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Введение 


Проявил себя — закрепи... 


От Фоменко 


Профессия программиста удивительна и уникальна. Давно уже настало время на- 
стоящего философского осмысления этой сферы человеческой деятельности, дей- 
ствительно обладающей какими-то особенными, для людей непосвященных чуть 
ли не магическими, свойствами. Если не брать в рассмотрение коммерческую сто- 
рону, то можно сказать, что чужих людей в этой области профессиональной дея- 
тельности нет. В чем же ее особенность? Наиболее точно по этому поводу выска- 
зался Фредерик Брукс в главе «Цятьдесят лет удивления, восхищения и радости» 
своей книги «Мифический человеко-месяц, или Как создаются программные сис- 
темы» [46]: «Немногим Бог дает право зарабатывать на жизнь тем, чем они с радо- 
стью занимались бы по собственной воле, по увлечению. Я благодарен судьбе». 
И далее: «Область связанных с компьютерами знаний претерпела взрыв, как и со- 
ответствующая технология. Будучи аспирантом в середине 50-х, я мог прочесть 
все журналы и труды конференций. Я мог оставаться на современном уровне во 
всей научной дисциплине. Сегодня мне в моей интеллектуальной жизни прихо- 
дится с сожалением расставаться с интересами то в одной, то в другой подобласти, 
поскольку количество документов превысило всякую возможность справиться 
с ними. Масса интересов, масса замечательных возможностей для учебы, иссле- 
дований и размышлений. Чудесное затруднение! Не только конца не видно, но 
и шаг не замедляется. В будущем нас ожидают многие радости». Что еще к это- 
му добавить? 


Структура книги 


Эту книгу можно рассматривать как своеобразную форму программного продук- 
та. Даже беглое ее пролистывание показывает, как много в ней программного кода. 
Более того, так как ассемблерный код неэкономичен с точки зрения использова- 
ния поверхности листа бумаги для его записи, то в тексте книги приведены лишь 
значимые для каждого конкретного контекста изложения фрагменты программ. 
Полные тексты этих программ содержатся отдельно, в материалах, прилагаемых 
к книге. Данные материалы хранятся на сайте издательства «Питер» (ВЁр://ммм. 
рИег.сот) и доступны по ссылке «Файлы к книгам». Некоторые наиболее объем- 
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ные по размеру исходного текста программы целиком вынесены в эти материалы 
без приведения их фрагментов в тексте книги. Для эффективной работы с ними 
читателю следует внимательно следить за ссылками на них и соответствующими 
пояснениями. Насколько это возможно, программы были проверены, но было бы 
опрометчиво утверждать, что вероятность появления ошибок в них равна нулю. 
Любому программисту, даже имеющему очень скромный опыт практической ра- 
боты, известно, что вероятность последней ошибки есть всегда. В связи с этим 
просьба к читателям сообщать о найденных ошибках по указанным ниже адресам 
электронной почты. 

Цель книги — дополнить учебник «АззетЫег», выпущенный издательством 
<Питер» [39], практическим материалом, используя который, программирующий 
на ассемблере сможет разрабатывать сложные полнофункциональные программы 
для различных операционных платформ. Характер подобранного материала при- 
кладной. Чтобы убедиться в этом, достаточно посмотреть оглавление книги. Кни- 
га состоит из 10 разных по объему глав. Ниже приведены краткие сведения о цели 
и характере содержимого каждой из этих глав. 


* Глава 1 «Программирование целочисленных арифметических операций». В этой 
главе приводятся исчерпывающие сведения об алгоритмах реализации четы- 
рех основных арифметических операций над числами различной разрядности. 
На практике нередко возникают ситуации, когда численные значения данных 
выходят за пределы максимально представимых диапазонов чисел в компью- 
тере. Тогда нужно использовать алгоритмы для производства вычислений над 
многобайтовыми (ОТ 1 до о) числами. Здесь же приведена реализация этих ал- 
горитмов для двоичных и двоично-десятичных (ВСО) чисел. Кроме этого, гла- 
ва содержит описание алгоритмов генерации псевдослучайных последователь- 
ностей, проблема организации которых также возникает достаточно часто. 


" Глава 2 «Сложные структуры данных». Содержимое этой главы значительно 
дополняет и расширяет содержимое одноименной главы 13 учебника. Доста- 
точно перечислить номенклатуру рассмотренных структур данных, названных 
«сложными», — это множества, массивы, структуры, таблицы, одно- и двусвяз- 
ные списки, деревья. Для демонстрации работы с этими «сложными структура- 
ми данных» подобраны интересные и востребованные на практике алгоритмы. 
Так, работа с массивами показана на примерах популярных алгоритмов сорти- 
ровки и поиска, работы с матрицами. Работа со структурами иллюстрируется 
на примерах организации массивов структур — таблиц. При этом наряду собыч- 
ными таблицами рассматривается специальный класс таблиц — таблиц с вы- 
числяемыми входами, или хэш-таблиц. Интересные примеры иллюстрируют 
выполнение основных операций над элементами одно- и двусвязных списков. 
Работа с сетью показана на примере организации в программе такой структу- 
ры, как конечный автомат. Заканчивается глава рассмотрением элементов ком- 
пиляции программ. Это логичное и оправданное с практической точки зрения 
завершение главы о сложных структурах данных. Наверняка каждому из вас 
приходилось организовывать элементарный языковой интерфейс с пользова- 
телем и обрабатывать его ввод. О существующих подходах к практической реа- 
лизации формальных механизмов распознавания ввода пользователя вы узна- 
ете из главы 2. 
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Глава 3 «Процедуры в программах на ассемблере». Также достаточно интересная 
глава, которая является существенным дополнением главы 15 «Модульное про- 
граммирование» учебника. Большое внимание уделено в ней реализации ре- 
курсивных процедур в программах на ассемблере. Реализация рекурсии в лю- 
бом языке — предмет дискуссии, причем от полного неприятия до слепого 
поклонения. Мы не стали принимать участие в этой дискуссии, а просто пока- 
зали технологию разработки рекурсивных программ на языке низкого уровня. 
Попутно обсуждению подвергаются проблемы передачи параметров и сохра- 
нения локальных параметров процедуры. В несколько более скромном объеме 
приведены сведения об организации вложенных процедур. В этой главе также 
содержится очень важный материал для программирующих под \/тдомз — 
о разработке и об организации работы с О1.Т.-библиотеками в программах на 
ассемблере. 


Глава 4 «Обработка цепочек элементов» содержит пример реализации некото- 
рых полезных алгоритмов поиска подстроки в текстовой строке. Материал этой 
главы представляет собой существенное дополнение (а где-то предлагает и аль- 
тернативные решения) главы 12 «Цепочечные команды» учебника. 


Глава 5 «Работа с консолью в программах на ассемблере» в полном объеме рас- 
сматривает проблему ввода информации с клавиатуры и вывода информации 
на экран компьютера. Для этого приведено описание соответствующих средств 
ВГО$, операционных платформ М$ РОЗ и \/ш4оу‘. 


Глава 6 «Преобразование чисел» предлагает набор алгоритмов для преобразо- 
вания представлений чисел между различными системами счисления. Этот вид 
преобразования данных также часто встречается на практике. Из-за того, что 
в ассемблере нет для этого соответствующих средств, каждый из программис- 
тов решает эту задачу по-своему, исходя из своего опыта и знаний. 


Глава 7 «Работа с файлами в программах на ассемблере» содержит системати- 
зированные сведения по работе с файлами из программ на ассемблере. За не- 
имением соответствующих средств языковой поддержки, со стороны програм- 
мистов на практике также наблюдается свободное творчество. Приведенные 
сведения относятся к уровню практической реализации задач в М5 ОО$ 
и \Мшдом с учетом возможности использования как длинных, так и коротких 
имен. 


Как оценить эффективность кода, который вы пишете? В этом вам поможет 
материал главы 8 «Оптимизация программного кода. Профайлер». В ней со- 
держится описание принципов оптимизации кода программы на ассемблере 
(и нетолько), а также описание двух макрокоманд, использующих средства про- 
цессора Репиит, которые помогут вам решить эту задачу. 


Глава 9 «Вычисление СКС» представляет варианты решения одной интерес- 
ной практической задачи, которой на практике можно найти достаточно много 
применений. Обладая этим инструментом, можно проводить быстрые оценоч- 
ные проверки целостности данных, которыми манипулирует ваша программа. 
Суть этих алгоритмов с первого взгляда не очень очевидна, поэтому данная глава 
содержит подробное их объяснение. 
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* Вглаве 10 «Расширение традиционной архитектуры Пе!» приводятся сведе- 
ния о порядке использования команд ММХ- и ХММ-расширений микропро- 
цессора Ге]. Более того, предлагается альтернативный подход к решению про- 
блемы поддержки работы с этими командами в программах на ассемблере. 
Механизм решения этой проблемы будет полезен и в других случаях, когда тре- 
буется обеспечить поддержку новых команд микропроцессора, работая со ста- 
рыми версиями компилятора (и не только ассемблера), процесс обновления 
которых по объективным причинам значительно более инертен, чем процесс 
обновления системы команд микропроцессора. 


Необходимо подчеркнуть тот факт, что программы книги реализованы с помо- 
щью двух версий ассемблера — 16- и 32-разрядной. Выбор операционной платфор- 
мы и средств реализации задач книги производился исходя из их конкретной 
постановки. Главный критерий здесь — подчеркнуть особенности реализации ал- 
горитма. Если для этого достаточно платформы М$ ОО$5, то задача реализовыва- 
лась с использованием средств этой ОС. При необходимости вы достаточно легко 
сможете доработать свою программу так, чтобы она функционировала в среде 
УЛ позу. Для этого книга содержит достаточно много практических примеров. 
Большое количество задач реализовано непосредственно для функционирования 
в среде У/пдом/з. Сделано это в основном на примерах консольных приложений. 

Материал книги не является автономным. В книге содержится много приме- 
ров, построенных наалгоритмах, описанных в общедоступной литературе. Это сде- 
лано намеренно. Во-первых, таким образом книгу можно интегрировать в качестве 
дополнительного учебного пособия в различные алгоритмические дисциплины. 
Во-вторых, экономится место для подробного пояснения сути алгоритмов. Для 
пояснения наиболее сложных алгоритмов в некоторых примерах книги введен 
псевдоязык, синтаксис которого рассмотрен в главе 2. Ради экономии места такой 
вид пояснения используется для текстов программ в файлах, прилагаемых к книге. 
Поэтому имейте в виду, что исходные тексты программ в материалах, прилагае- 
мых к книге, немного отличаются от соответствующих текстов программ в кни- 
ге — прежде всего тем, что первые снабжены более подробными комментариями 
и псевдокодом. Для общеизвестных алгоритмов приведены ссылки на источники, 
где с ними можно познакомиться более подробно. Более того, система нумерации 
программ сделана так, чтобы указать читателю ссылку на источники, которые по- 
дойдут для более глубокого изучения соответствующих алгоритмов. Следует от- 
метить, что псевдоязык использован с двоякой целью. Первую из целей мы уже 
отметили, что касается второй, то она заключается в том, чтобы подготовить чи- 
тателя к изучению теории компиляции. Так, пояснение примеров программ на 
ассемблере производится не только с помощью обычных комментариев, но и сдоба- 
влением фрагментов программ на псевдокоде. Такое смешанное пояснение ассем- 
блерной реализации алгоритма не только дополнительно иллюстрирует сам алго- 
ритм, но и показывает суть третьего и четвертого этапов компиляции программы — 
генерации и оптимизации кода, так как при этом можно видеть, какие ассемблер- 
ные (машинные) конструкции могут соответствовать конструкциям языка высо- 
кого уровня. Для улучшения понимания реализации алгоритмов на ассемблере 
в некоторых из них отсутствует какая-либо оптимизация, вплоть до того, что при- 
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сутствуют фрагменты кода, которые можно удалить. Это сделано исходя из двух 
соображений. Во-первых, с тем чтобы сохранить замысел автора алгоритма. Чита- 
тель волен сам решать, что и в каком объеме может быть улучшено и усовершенство- 
вано в программе для решения конкретной практической задачи. Во-вторых, опти- 
мизированный текст труднее для понимания. Более того, как будет показано 
в главе 8, оптимизация имеет смысл в случае, когда ясна программно-аппаратная 
среда, в которой будет работать программа. 

Следует обратить особое внимание, что книга не имеет дискеты или компакт- 
диска с текстами программ. Все они содержатся на сайте издательства «Питер» 
в разделе «Файлы к книгам». 

Завершает книгу достаточно подробный список литературы, которая была ис- 
пользована в процессе подготовки книги и которую можно рекомендовать как ос- 
нову для дальнейшего изучения затронутых в ней вопросов. 


От издательства 


Ваши замечания, предложения, вопросы отправляйте по адресу электронной по- 
чты автора у_уигоу@тай.ги или компьютерной редакции издательства «Питер» 
сотр@рКег.сот. 

Мы будем рады узнать ваше мнение! Все пожелания читателей будут учтены, 
при необходимости дан ответ. Кроме того, обнаруженные в программах ошибки 
будут исправлены, и соответствующие изменения будут оперативно внесены в со- 
держимое материалов, прилагаемых к книге, которые можно найти на \6Б-сайте 
издательства В р://ммм.рЖег.сот. 

Подробную информацию о наших книгах вы найдете на \’ер-сайте издатель- 
ства НЁр://млим.рКег.сот. 


Глава 1 


Программирование 
целочисленных 
арифметических операций 


Всякое математическое доказательство, за которым мы можем следить, выразимо конечным 
числом символов. Эти символы, правда, могут быть связаны с понятием бесконечности, НО СВЯЗЬ 
эта такова, что ее можно установить за конечное число шагов. Так, когда в случае математической 
индукции мы доказываем теорему, зависящую от параметра п, мы доказываем ее сначала для п = 0 
и затем устанавливаем, что случай, когда параметр имеет значение п + 1, вытекает из случая, когда 
параметр имеет значение п. Тем самым мы убеждаемся в правильности теоремы для всех 
положительных значений параметра п. Более того, число правил действия в нашем дедуктивном 
механизме должно быть конечным, дажеесли оно кажется неограниченным из-за ссылки на понятие 
бесконечности. Ведь и само понятие бесконечности выразимо в коиечных терминах. 


Н. Винер, «Кибернетика, или Управление и связь в животном и машине» 


В главе 8 «Арифметические команды» учебника было приведено достаточно под- 
робное (с соответствующими рассуждениями и примерами) описание возможнос- 
тей процессора по выполнению арифметических операций над целочисленными 
данными. Также было отмечено, что при выполнении этих операций возникают 
характерные ситуации, обнаружение и обработка которых возлагается на програм- 
миста. Именно этому вопросу мы и уделим внимание в данном материале. Внача- 
ле вспомним основные моменты. 

Процессор Иие] имеет средства для обработки целочисленных арифметических 
данных двух форматов: двоичного и двоично-десятичного (ВСО). Данные в дво- 
ичном формате рассматриваются как числа со знаком и без знака. При этом необ- 
ходимо заметить, что не существует отдельного формата для чисел со знаком и без 
знака. Один и тот же двоичный код может рассматриваться как значение со зна- 
ком и без знака. Все зависит от того, как трактуется старший бит операнда. Для 
чисел без знака он является старшим значащим битом операнда. Для чисел со зна- 
ком смысл старшего значащего бита операнда меняется: его нулевое значение со- 
ответствует положительному числу, единичное — отрицательному. Остальные 
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разряды операнда — значащие. Но здесь есть один нюанс, смысл которого в том, 
что остальные разряды не являются модулем числа. Для положительного числа 
они действительно являются абсолютной величиной числа, а вот для отрицательно- 
го числа они представляют собой так называемый дополнительный код числа. Идея 
дополнительного кода состоит в том, что процессору совсем необязательно иметь 
отдельные устройства для сложения и вычитания. Достаточно только одного — сум- 
матора. 

Есть всего лишь две команды в системе команд процессора, которые восприни- 
мают старший бит операнда как знаковый, — это команды 1МИЕ и ТОМ. В осталь- 
ных случаях забота о правильной трактовке старшего бита ложится на программ- 
ное обеспечение. Программирующий на ассемблере должен сам предусматривать 
особенности обработки знаковых битов. 

Другая характерная ситуация при выполнении арифметических действий — 
переполнение и антипереполнение. Их причина — ограниченность разрядной сет- 
ки операнда. При выполнении операции сложения или умножения возможен вы- 
ход результата за пределы разрядной сетки. Если результат больше максимально 
представимого значения для операнда данной размерности, то говорят о ситуации 
переполнения. Иначе, если результат меньше минимально представимого числа, 
то говорят о ситуации антипереполнения (потери точности). При этом результат 
также верен, но при его соответствующей трактовке. Все эти рассуждения приве- 
дены в главе 8 «Арифметические команды» учебника, и повторять мы их не будем. 
Сосредоточимся на практическом аспекте этого вопроса. Ситуация переполнения 
может иметь место при вычислениях, в которых заранее не известен размер опе- 


рандов. 


Двоичные числа 


Прежде чем программировать, 
залишите программу в псевдокодах. 


Д. Ван Тассел 


Сложение двоичных чисел 


Сложение чисел размером 1 байт без учета знака 


ее ------ + 
;| Выход: зим Ь или зим м — значение суммы с учетом переполнения | 
еее еее -+-- + 
.аафа 

зиптапа 1 [1 ? 

зиттай 2 [е ? 

5 м Табе]  мюга 

зип Б Ч 0 

саггу [1 0 

соде 


аа ип$19п ргос 
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ЮУ а1. зиттайа_2 
ааа а1. зиттайа_1 
[Ще $ит_Ь. а] 
дис епа р ; проверка на переполнение 
ас саггу, 0 
епа_р: ге 
ад4_ип$19п епар 


Программа учитывает возможное переполнение результата. Сложение двоич- 
ных чисел большей размерности (2/4 байта) выполняется аналогично. Для этого 
необходимо заменить директивы ОВ на 0М//0В и регистр АЁ на АХ/ЕАХ. 


сео чисел размером М байтов без учета знака 


зиттапа_1 [е С ; первое слагаемое 
М = $ - зимтапа 1 : длина в байтах зиттапа_1 и зиттапа_2 
саггу [6 0 ; перенос сложения последних байтов 
зиттапа_2 [ео г ; второе слагаемое 
.соде 
ада ипз1дп_№ ргос 
оу С. № 
хог $1. $1 
СУСТ: оу а1. зиттапа_2[$1] 
адс зиттапа 1[51]. а] 
тис $1 
100р — сус1 
дис епа р : проверка на переполнение 
адс Саггу. 0 
епд р: ге 


а04 ипз1дп №  епар 
Программа учитывает возможное переполнение результата. Сегмент данных 
может быть задан, например, так: 


„даба 
зилтапа_1 а 0. 34. 56, 78 ; первое слагаемое ` 

№ = $ - зимтапд 1 ; длина в байтах зиттапа 1 и зиттапа_2 
саггу [е 0 ; перенос сложения последних байтов 
зиттапа_2 4 0. 43. 65. 230 : второе слагаемое 


Далее при рассмотрении программы деления многобайтовых двоичных чисел 
нам понадобится макрокоманда сложения без учета знака чисел размером М бай- 
тов (порядок следования байтов не соответствует порядку следования байтов 
в процессорах Ге! то есть старший байт находится по младшему адресу). Приве- 
дем ее. 


Сложение без учета знака чисел размером М байтов (макрокоманда) 


„даба 

;зиттапа_1 [ее ? ; первое слагаемое 

} М = $ - зиттапа 1 ; длина в байтах зиттайа 1 и зиттапа_2 
;саггу [69 0 ; перенос сложения последних байтов 
;зилтапа_2 | ? ; второе слагаемое 


.соде 
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ава | 40$19п_М масго  саггу. зиттапа_1. зиттапа_2. М 


:| Макрокоманда: а44 ип$19й_М саггу. зилтапа_1. зиттапа_2. М 1 
:| Сложение без учета знака чисел размером № байтов. | 


а Е Е ое ии о ше ь + 

1оса!1  сус!. епа р 
ЮУ 1. М 
ЮУ 51. №-1 

СуС1: ие а1. зиттайа_2[$1] 
аас зиттапа 1[51]. а1 
дес 51 
1о0р — сус 
дпс епа р 
айс саггу.0 

епа_р: пор 
епат 


И И Иа а аа В Е ыы + 
1 Вход: зиттапа 1 и зиттапЧ_2 — слагаемые. | 
Е А ЕЕ Е И лос ВЕР КА оо. ыы 
7 Выход: ит Б или зит м — сумма в зависимости от наличия расширения знака. | 
еее + 
ие 
ИТМ Табе]  мюга 
зитапа_1 [ев ? 
саггу [ео] 0 ‚знаковое расширение 
зиттапа_2 Ф ? 
.соде 
ааа $19п ргос 
оу а1. зиттапа_2 
ааа зиттайа 1. а} 
с @@сР1 оР1 
30 @@СРО 1 
Ея 2-0 и 0#=0 -> результат. верный и с!=1 о{=0 -> результат верный 
г_{иие: Зир ела р ; результат -> зиттапа_1 
@@ст1 01: Зло @вест1 ото 
:------ СГ=1 оГ=1 -> результат неверный 
ЮУ саггу. ОРТ : расширение знака = 1. результат -> $ит м 
Зир епа_р 
ес = СЕ=Р и 0Г=0 -> результат. верный 
@@сР1 ог0: Эр г {гие : результат -> зиттапа_1 
ЕЕ СР=0 и 0{=1 -> результат `неверный 
@@СГО от]: ет саггу. 0 ; расширение знака = 0. результат -> $ит м 
Эр епа_р 
епа р: ге 


ад4 $1дп епар 

Программа учитывает возможное переполнение результата и перенос в стар- 
шие разряды. Для этого отслеживаются условия, задаваемые флагами, и выполня- 
ются действия: 
# СРЕ= ОР = 0 — результат правильный и является положительным числом; 


СЕ = 1, ОР= 0 — результат правильный и является отрицательным числом; 
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“ 


® СЕ = ОЕ = 1 — результат неправильный и является положительным числом, хотя 
верный результат должен быть отрицательным (для корректировки необходи- 
мо увеличить размер результата в два раза и заполнить это расширение нуле- 
вым значением); 

® СЕ=0, ОР = 1 — результат неправильный и является отрицательным числом, хотя 
правильный результат должен быть положительным (для корректировки не- 
обходимо увеличить размер результата в два раза и произвести расширение 
знака). 

Сложение чисел большей размерности (2/4 байта) со знаком выполняется ана- 
логично, для этого необходимо внести изменения в соответствующие фрагменты 
программы. В частности, необходимо заменить директивы ОВ на 0\/0 и регистр 
АЕ на АХ/ЕАХ. 


Г ПОЖЕНИЕ с учетом знака чисел размером М байтов 


ты 
зиттапа_1 Ф ? : первое слагаемое 
М = $ - зимтапа_1 : длина в байтах зиттапа 1 и зиттапа_2 
саггу [69 0 : расширение знака 
зиттапа_2 [6 ? : второе слагаемое 
.соде 
ада $19п_М№ ргос 
МОУ сх. М 
ЮУ $1.0-1 
суСТ: пс $1 
по\ а1. зиттапа_2[$1] 
аас зиттапа 1[5$1].а1 
Тоор сус1 
3 @@ст1 ог1 
до @@ст0_оЁ1 
1------ С1-=0 и о[=0 -> результат верный и сР=1. о1=0 -> результат верный 
г_фгие: Зир епа ; результат -> зиттайа_1 
@@сг1_оГ1: Зпо @@с11 ого 
у------ С1=1 и 07=1 -> результат неверный 
ей саггу, ОР :расширение знака = 1. результат -> $ит м 
Зпр епа_р 
;------ С#=] и 07=0 -> результат верный 
@@с71_от0: Зпр г {тие ; результат -> зиттапа_1 
1------ С1=0 и 07=1 -> результат ‘неверный 
@@стО_0о11: ОУ саггу. 0 ; расширение знака = 0. результат -> зим м 
епа р: геф 
аа4_$19п_М епар 
Сегмент данных может быть задан, например, так: 
.Чаба 
зиттапа_1 [ев 32. 126. -120 —:; первое слагаемое 
у М = $ - зимтапа 1 : длина в байтах зиттай@_1 и зиттайа_2 
саггу |) 0 : расширение знака 
зиттапа_2 [6] 126. 125. -120 : второе слагаемое 


Программа учитывает возможное переполнение результата. Обратите внима- 
ние на порядок задания значений слагаемого. Если слагаемое положительное, то 
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проблем нет. Отрицательное слагаемое размером Мбайтов для своего задания тре- 
бует некоторых допущений. Старший байт отрицательного слагаемого задается со 
знаком и в процессе трансляции будет преобразован в значение, являющееся дво- 
ичным дополнением исходного значения. Остальные байты в своем исходном виде 
должны быть частью дополнения исходного значения. Поэтому для работы с чис- 
лами со знаком удобно иметь программу, которая бы выполняла вычисление зна- 
чения модуля отрицательного числа и, наоборот, по значению модуля вычисляла 
его дополнение. 


Вычисление двоичного дополнения числа 
размером М байтов 


:| Вход: Бх — адрес операнда в памяти. | 
| сх — длина операнда. | 


ее ------ + 
.соде 
са1с_сотрТетете ргос 
хог 51,51 $ 
пед Бие рёг [6х] : дополнение первого байта 
стр Б\е рёг [6х]. 0 : нулевой операнд — особый случай 
пе $Ноге $+3 
$с : установить СР, так как есть перенос 
дес 
3схг 0@т1 ; для однобайтового операнда 
@@сус1: тис $1 


пое Буфе рёг [6х1[$1] 
аас Буёе рег [6х][$1]. 0 
Тоор @@сус1 

@@т1: ге 

са1с_сотрТетепте епар 


Для значений размерностью 1/2/4 байта дополнение можно получать с по- 
мощью одной команды МЕС: 
пед орегапа 
Для значений в № байтов необходимо реализовывать алгоритм. Дополнение пер- 
вого байта требуется вычислять с учетом того, что он может быть нулевым. Попытка 
получитьего дополнение с помощью команды МЕб обречена на провал. Флаг СЕ вэтом 
случае также должен устанавливаться программно. Подумайте, почему? 


Вычисление модуля числа размером М байтов 


_ Вход: Бх — адрес операнда в памяти. | 
м сх - длина операнда. ] 
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.соде 
са1с_а6$ ргос 
1+----- определим знак операнда 

тоу а сх 
дес 
фе5 Е рг [5х16$11. 808 ;проверяем знак операнда 
2 {@@ех11 :число положитепьное 
са?1 са1с_сотр1етет 

@Фех1с: геё 

са1с_а6з епёр 


Вычитание двоичных чисел 
Вычитание чисел размером 1 байт без учета знака 


а ----------- =---+ 
: Процедура: зи6 ипз19п. Вычитание чисел размером 1 байт без учета знака. 1 


еее + 
м 
тилиепа [69 ? ; уменьшаемое 
седис оп [619 ? ; вычитаемое 
„.соде 
$5 _ип$19п ргос 
ЮУ а1. дедис Топ 
5иБ пллиела, а] 
ен - оцениваем результат на случай уменьшаемое < вычитаемого 
пс еа_р :нет заема 
я обрабатываем ситуацию заема из старшего разряда — 
: получаем модуль (если нужно) 
пед пииела 
епа р: ге 
$95 ип$19п епар 


Программа учитывает возможное соотношение: уменьшаемое < вычитаемого. Вы- 
читание чисел большей размерности (2/4 байта) выполняется аналогично. При 
этом необходимо заменить директивы ОВ на 0\//00 и регистр АЁ на АХ/ЕАХ. 


вымитание чисел размером М байтов без учета знака 


ее Еее И ааа ны бЕНЫ + 
а 
тииепа [419 ? : уменьшаемое 
№ =$ - О ; длина в байтах пилиепа и дедис оп 
Оедисслоп [619 ? ; вычитаемое 
.соде 
$6 ип$19п_М ргос 
ЮУ с. М 
хог $1, $1 
сус1: ОУ аТ. дедис1от[$1] 
$ЬЬ п7лиепа[$1]. а] 
пс @@т1 
пед птлиела[$1 ] 
@@т1: 17с $1 


1оор Сус] 
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ге 
55 ип$19п_№ епар 


Программа учитывает возможный заем из старигих разрядов. Длина уменьшае- 
мого должна быть не меньше длины вычитаемого, недостающие разряды вычитае- 
мого должны быть нулевыми. В любом случае, результат — абсолютное значение. 

Сегмент данных может быть задан, например, так: 


.дафа 

м еди 5 :длина в байтах тлпиепд и дедис 1оп 
Мтпиепа [6] 9) 30. 43. 65. 230. 250 ; уменьшаемое 

Ведисе1оп [419 45. 34, 65. 78. 250 : вычитаемое 


РыНИтАНЫе чисел размером 1 байт с учетом знака 


ее еее не + 
.дафа 

еди 2 ; длина в байтах результата в ситуации 

; расширения знака для расчета его модуля 

тзилцела [619 ? : уменьшаемое 
саггу 96 0 : расширение знака 
дедис (топ [9 2 ; вычитаемое 
.соде 
$46 $19п ргос 

МОУ а1. дедис оп 

5иЬ птлиело. а1 

1------ оцениваем результат 
Зис по саггу ‚нет заема 


НЕЕ ЕНЕ обрабатываем ситуацию заема из старшего разряда — 
: получаем модуль (еспи нужно} 


. пед птиоепа 
"р ета р 
по_саггу: 7$ по_$19п 


ЕЕ Е обрабатываем ситуацию получения отрицательного результата — 
| получаем модуль (если нужно) 


пед плипиеяа 
тр епд_р 
по_$19п: по ло оуег оч 


1------ обрабатываем ситуацию переполнения — 

: получаем модуль (если нужно). 
расширяем результат знаком — получаем модуль (если нужно) 
ЮУ саггу. 0 
са11 са1с_аБ$ 


по оуег{1ом: 
епа р: ге 
$и5_ $197 епар 


Программа учитывает возможный заем из старших разрядов. Вычитание чисел 
большей размерности (2/4 байта) выполняется аналогично. Необходимо заменить 
директивы ОВ на 0\//00 и регистр А( на АХ/ЕАХ. Подробности зависимости состоя- 
ния флагов от результата см. в главе 8 «Арифметические команды» учебника. 


рычиание чисел размером М байтов с учетом знака 
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| Вход: птлиеп@ и дедис1оп — уменьшаемое и вычитаемое, № — плина в байтах. | 


еее - + 
| Выход: тпиел@ — значение разности. | 
еее неа --- + 
.дафа 
тииепа 6 ? ; уменьшаемое 
Теп_пипиепа = $ - пупиеп@ ; длина в байтах уменьшаемого и вычитаемого 
саггу ЧБ 0 ; расширение знака 
дедис Топ [6] 2 ; вычитаемое 
.соде 
$иБ_$19п_М ргос 
ЮУ сх. Теп пппиепа 
ОУ $1. 0 
661: ЮУ а1. дедисеТот[$1] 
$56 ицепа[$1], а] 
77с $1 
Тоор @@т1 
ее ы оцениваем результат 
дис по _саггу ; нет заема 


ен -- обрабатываем ситуацию заема из старшего разряда — 
: получаем модуль (если нужно) 
М = 1еп тзлиела + 1 
ОУ саггу. ОР 
са11 са1с_аБ$ 
р ебр 
по_саггу: 05 по_519п 
ЕЕ обрабатываем ситуацию получения отрицательного результата - 
; получаем модуль (если нужно) 
М = 1Теп_тпиепа 
са11 са1с_аБ$ 
Зир ета р 
по_519п: по по_оуег1ом 
------ обрабатываем ситуацию получения отрицательного результата — 
; получаем модуль (если нужно). 
} расширить результат знаком — получаем модуль (если нужно) 
№ = Теп тлиепа + 1 
ЮУ саггу. ОР 
са11 са1с_аЬ$ 
по_оуегР Том: 
епа_р: ге 
5иБ_$19п_М епар 


Описанная процедура вычисляет модуль разности и учитывает возможный 
заем из старших разрядов. Если вычисления модуля разности не требуется, то 
закомментируйте строки, содержащие команду САЦ. са[с_а55. Подробности зави- 
симости состояния флагов от результата см. в главе 8 «Арифметические коман- 
ды» учебника. 

Сегмент данных может быть задан, например, так: 


.дафа 
тлиепа [619 251. ОТ4в. бей; уменьшаемое 
1еп_птпиепа = $ - тлиеп@ ; длина в байтах уменьшаемого и вычитаемого 
саггу [619] 0 ; расширение знака 
дбедис Тот [419 5и, 0148, ОИ ; вычитаемое 


Далее при рассмотрении программы деления многобайтовых двоичных чисел 
нам понадобится макрокоманда вычитания с учетом знака чисел размером № бай- 
тов (порядок следования байтов не соответствует порядку следования байтов на 
процессорах 1п&е1, то есть старший байт находится по младшему адресу). Приве- 
дем ее. 


24 Глава 1. Программирование целочисленных арифметических операций 
Вычитание с учетом знака чисел размером М байтов (макрокоманда) 


:| Макрокоманда: зиб_$19п_№ п1пиепа. дедис ол. М. ] 
;| Вычитание с учетом знака чисел размером № байтов. | 


ее -- + 
| Вход: илиеп@ и дедис1оп - уменьшаемое и вычитаемое. № — длина в байтах. | 
еее еее еее еее -- + 
| Выход: птпиепа — значение разности | 
еее -- + 


-в _$19п_№ пасго  тпиепа. дедистол. М 
]10Са1  сус1. 1 
рип $1 
ЮУ С]. М 
МОУ $1. м-1 
СУСТ: ем а1. дедис1от[ $1) 
$5 пииепа[$1]. а1 
упс т 
лед ппииепа[$1 ] 
м]: дес $1 
100р  сус1 
рор $1 
епат 


Умножение двоичных чисел 


В отличие от сложения и вычитания операция умножения реализуется двумя ти- 
пами команд — учитывающими и не учитывающими знаки операндов. 


мИожеНиЕ чисел размером 1 байт без учета знака 


О Вход: ти] 1р}1ег1 и ту] {1р11ег2 — множители размером 1 байт ] 
еее + 
:| Выход: ргодисё — значение произведения. | 
ее ------- + 
а 
ргодисе Табе? — мога 
ркгодисЕ 1 Табе? Буе 
миТетр1Тег1 [6 ? : множитель 1 
: (младшая часть произведения) 
ргодисе_И 6 0 : старшая часть произведения 
ми 1р1Тег2 [69 ? ; множитель 2 
.с0бе 
ПИТ и7$19п ргос 
ЮУ а1. ми] 1р11ег1 
1 иир1тек2 
1------ оцениваем результат 
змс по_саггу : нет переполнения — на по_саггу 
1------ обрабатываем ситуацию переполнения 
МОУ ргобисф п. аи ; старшая часть результата 
по_саггу: ЮУ рговисё_1. а1\ : младшая часть результата 
ге 
Пи] _и7$19л епар 
па1л: 
са11 пи] _ий$19й 


еп та1п 
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Здесь все достаточно просто и реализуется средствами самого процессора. Про- 
блема состоит лишь в правильном определении размера результата. Произведе- 
ние чисел большей размерности (2/4 байта) выполняется аналогично. Необходи- 
мо заменить директивы ОВ на 0\//00, регистр АЁ на АХ/ЕАХ, регистр АН на ОХ/ЕБХ. 


Умножение чисел размером Ми М байтов без учета знака 


Для умножения чисел размером №и М байтов существует несколько стандартных 
алгоритмов, описанных в литературе [5, 8]. В этом разделе мы рассмотрим только 
один из них. По сути это закодированный на языке ассемблера процессоров [пе] 
алгоритм умножения неотрицательных целых чисел, предложенный Кнутом [5]. 


Умножение М-байтового числа на число размером М байтов 


ПРОГРАММА пи] _ип$19и_ММ 

// тиТ_ип$19п_ММ — программа на псевдоязыке умножения №-байтового числа 

// на число размером М байтов 

// (порядок — старший байт по младшему адресу (не 1пёе1)). 

// Вход: Ци \ -— множители размерностью М и М байтов соответственно. 

1/1 Ь = 256 — размерность машинного слова. 

// Выход: М — произведение размерностью М + М байтов. 

ПЕРЕМЕННЫЕ 

МТ ВУТЕ чп): уп]; м[ичт]; К=0: 

ТМТ ОКО Ь=256; фетр мога 

НАЧ ПРОГ 

ДЛЯ `9:=М-1 ДО 0 /! 3 изменяется в диапазоне М-1..0 
НАЧ БЛОК_1 
// проверка на равенство нулю очередного злемента множителя (не обязательно) 
Е у[3]==0 ТО ПЕРЕЙТИ_НА пб 


К:=0; 1:=п-1 // 1 изменяется в диапазоне №-1..0 
ДЛЯ 1:=№-1 00 
НАЧ БЛОК_2 


// перемножаем очередные элементы множителей 
тетр_мог@:=и[1 3%*/( 3 ]+и[1+)+1 ]+К 


м[1+)+1] :={етр_мога М00 Б // остаток от деления Еетр_мог@\Ь -> м[1+]+1] 
К: =Фетр могд\Ь // целая часть частного тетр мога\Ь -> К 
КОН _БЛОК_2 

м3] :=К 

пб: 

КОН БЛОК_1 


о ПРОГ” 


|| Программа: ти] _ип$19п_ММ. ат. ] 
:| Умножение №-байтового числа на число размером М байтов. | 


Вход: И - Ц, щи, — множитель_1 размерностью № байтов. | 
У - м... м — мнонитель_2 размерностью М байтов. | 


[6 2 ый 
1=$-0 Г Т=М 
у [6 2 :\ 
3 =$-\ 3-м 
Теп_ргодисе = $ - Ц 
и [е19) Теп_ргобисЕ дир (0); и 
К [6 0 : перенос 0 < К < 255 
Ь [6 1008 : размер машинного слова 
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м1 _ип$19п_М№  ргос 


ризй 9х 
1: 
тоу Ьх. 1-1 
;------ ДЛЯ 3:=М-1 д 0 //3 изменяется в диапазоне М-1..0 
ЮУ сх. 
м2: НАЧ БЛОК_ а 
ризи` сх : вложенные циклы 
стр Ух]. 0 ; ЕСЛИ у] ]==0 
т 3е тб : ТО ПЕРЕЙТИ НА пб 
оу $1.1-1 ; 1=0..п-1 ;К:=0; 1:=п-1 
: // 1 изменяется в диапазоне №-1..0 
ЮУ сх. 1 
МОУ к. 6 : ДЛЯ 1:=№-1 ДО 0 НАЗ БЛОК 2 
ЕЕ-ЕЫЫ /! перемножаем очередные злементы множителей 
пд: ое а\, и[51} ; Сетр мога:=и[1 }*у[ 3 }+и[1+)41 ]+К 
пи] Буе рёг у[Ьх] 
моутх 9х. м[Бх+51+1] 
ада ах. ах 
ЮУ 91. К 
ада ах. @х ; {2ах - временная переменная 
1------ м[1+)+1] :=5етр_мога МОВ Б 
: //остаток от деления Фетр мог@\Ь -> м[1+3+1] 
К: =бетр_ мог@\Ь 
//целая часть частного фетр_мог@\Ь -> К 
хог 9х. 9х 
Чу Ь 
то К. а1 
ет им[Ьх+$1+1]. 91 
В.) 
дес $1 
1о0ор 14 : КОН БЛОК_2 
тоу а1, К : м0: =к 
пюу и[Ьх}. а\ 
пб: дес Ьх 
рор сх 
100р п? ; КОН БЛОК 1 
геё : КОН ПРОГ 
рор 9х 
Ми] _ 75191 № епар 
ма1п: 
са11 п ип519т ММ 
еп тат 


В отличие от обычного умножения «в столбик» в данном алгоритме сложение 
частичных произведений выполняется параллельно умножению. Программа про- 
изводит умножение значений в следующем порядке — старший байт по младшему 
адресу. Это неестественно для процессоров [ше], поэтому программу необходимо 
соответствующим образом изменить. Текст измененной процедуры пи _ипя1дп_ММ_1Т 
приведен среди файлов, прилагаемых к книге. 

Процедуру умножения чисел без учета знака тш_ип$1ап_М№М удобно предста- 
вить в виде макрокоманды ти: ип$19п_ММ_ги, 1, \, ], м. Это без излишних усложне- 
ний сделает ее вызов более универсальным. При последующем рассмотрении про- 
граммы деления многобайтовых двоичных чисел она будет использована нами 
с большой пользой. Текст макрокоманды приведен среди файлов, прилагаемых 
к книге. Там же имеется вариант этой макрокоманды ти[_ип$1ап_М№М на случай ес- 
тественного для процессоров п] расположения операндов — младший байт по 
младшему адресу. 
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но жения чисел размером 1 байт с учетом знака 


а 
ргодисе ]ЛаБе] — могд 
ргодис®_1 ]Лабе!1 Буе 
пи 1р1тег1 [419 ? : множитель 1 
: (младшая часть произведения) 
ргодис® п [69 0 ; старшая часть произведения 
пметр1Тек2 [419 ? ; множитель 2 
.с0де 
пи] _ $197 ргос 
ЮУ а1. мл 1р11ег1 
ил мир! 1ег2 
Ею оцениваем результат 
Зис по саггу :нет переполнения — на по саггу 
;------ обрабатываем ситуацию переполнения 
ЮУ ргодисЕ п. аи; старшая часть результата. 
: знак результата — старший бит ргодисе_П 
по_саггу: ПЮУ ргодисЕ_1. а\ :; младшая часть результата. 
: ргодис®_И - расширение знака 
ге 
мл_$19п епар 
пали: 
са11 ми1_ 5191 
еп пал 


Аналогично умножению без знака здесь также все достаточно просто и реали- 
зуется средствами самого процессора. Проблема та же — правильное определение 
размера результата. Произведение чисел большей размерности (2/4 байта) вы- 
полняется аналогично. Необходимо заменить директивы ОВ на 0\//00, регистр АЁ 
на АХ/ЕАХ, регистр АН на ОХ/ЕБХ. Более того, в отличие от команды МИЁ команда 
1МУЕ допускает более гибкое расположение операндов. 


Умножение чисел размером М и М байтов с учетом знака 


Система команд процессора содержит два типа команд умножения — с учетом зна- 
ков операнда (1МИ1.) и без него (МИГ). При умножении операндов размером 1/2/ 
4 байта учет знака производится автоматически — по состоянию старших (знако- 
вых) битов. Если умножаются числа размером в большее количество байтов, то 
для получения правильного результата необходимо учитывать знаковые разряды 
только старших байтов. В основе программы, реализующей алгоритм умножения 
чисел размером Ми М байтов с учетом знака, лежит рассмотренная выше процеду- 
ра умножения чисел произвольной размерности без учета знака. 


Умножение М-байтового числа на число 
размером М байтов с учетом знака 


// пы1_519п_ММ — программа на псевдоязыке умножения №-байтового числа 

// на число размером М байтов 

// (порядок — старший байт по младшему адресу (не Тпёе!)) 

{/ Вход: Чи \ — множители со знаком размерностью М и М байтов соответственно; 
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(1 Ь = 256 - размерность машинного слова. 
// Выход: И — модуль (дополнение) произведения размерностью № + М байтов 
ПЕРЕМЕННЫЕ 


ТМГ ВУТЕ уп); //нножитель 1 размерностью № байтов 
ТАТ ВУТЕ У[п]; //:множитель 2 размерностью М байтов 
ТМГ ВУТЕ м[пчт]; К=0; — //перенос 0 < К < 255 

ТТ ВУТЕ $191=0; //информация о знаке 

ТМТ МОРО Б=256; фетр мог@  //Ь - размер машинного слова 
НАЧГПРОГ 


// определим знак результата 

ЕСЛИ БИТ_7 БАЙТА( (и(0] АМ 808) ХОВ ч[0])==1 ТО $19п:=1 //результат 

// будет отрицательным 

/!/ получим модули сомножителей: 

и: = и] 

у:=[\] 

м:=ти1_ип$19п_ММ() //в зтой точке — модуль результата 

// восстанавливаем знак результата 

ЕСЛИ $197==0 ТО ПЕРЕЙТИ НА @@т 

// для отрицательного результата вычислить дополнение значения м длиной 1+} 
ВС ое“ // в этой точке - двоичное дополнение результата 
@ 

о ПРОГ 


| Программа: пи] _$19п_№М.азт. | 
:| Умножение №-байтового числа на число размером М байтов. | 


Вход: 0 - Ч. .-м м, — множитель_1 размерностью № байтов. | 
у - у. в к — множитель_2 размерностью М байтов. | 


|| Порядок — старший байт по младшему адресу (не мЕеТ). | 
Включить описание процедур са1с_сотр1ететё г, са1с_аБ$_г. м _ип$1ди ММ. | 
Помните. что задание отрицательных многобайтных значений в | 
сегменте данных должно производиться в дополнительном коде ] 

| 


(и в порядке старший байт по младшему адресу)! 
+ 
дафа 
[919 ? : множитель 1 размерностью № байтов 
1=$-0 
у 5 ? ; множитель 2 размерностью М байтов 
9 =$-\ 
Теп_ргодис® = $ - 0 
И [е*) Теп_ргодис® дир (0) ; результат длиной № + М байтов 
к 5 0 : перенос 0 < К < 255 
Ь [6 1008 : размер машинного слова 
519" [е19) 0 : информация о знаке 
.соде 
м1 _$19п_ ММ ргос 
=== определим знак результата р 
хог ах. ах : ЕСЛИ БИТ_7_БАИТА( (и[0) АЮО 808) 
; ХОВ ,[0])==1 ТО $191:=1 
оу а]. и 
апа а1. 808 
хог а1, у 
ы ах. 7 
пс $+7 
ОУ $191, 1 : результат будет отрицательным 
1еа Ьх. у ; модули сомножителей: и:=|и[; м:=[\| 
МОУ сх. 3 
са11 са1с_абз_г 
Теа Ьх. и 
ОУ сх. 1 


са11 са1с_а5$_г 
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НЕЕ теперь умножаем 

са11 7147519 7_М о: м: =ты1 илл ММО 
у------ в этой точке — модуль результата 
ь восстанавливаем знак результата 


хог $1. $1 . 
стр $191. 0 : ЕСЛИ $19п==0 ТО ПЕРЕЙТИ НА @@т 
3е @@т 


1------ для отрицательного результата вычислить 
дополнение значения м длиной 1 + ] 
оу 6х1 +) : м:=са1с сопрТетете г(): м[0]:=0-м[0] 
Теа Ьх. м 
са11 са1с сотрТетеле_г 

:------ в этой точке — двоичное дополнение результата 


вет: ге :КОН_ПРОГ 
1 _5197_№М епар 
па?т: 


са? мит_$19п ММ 

еп@ та?п т 

Процедура ти! _$19п_ММ выполняет умножение с учетом знака исходных значе- 
ний в следующем порядке байтов — старший байт по младшему адресу. Если вы 
используете отрицательные значения операндов, то для правильной работы тесто- 
вой программы в сегменте данных их необходимо задать в дополнительном коде. 

В данной программе появились две новые процедуры — са(с_сотр(етепЕ_г 
и са[с_а5$_г, вычисляющие соответственно дополнение и модуль числа размером 
Мбайтов. Подобные процедуры уже были разработаны и введены нами для значе- 
ний, порядок следования байтов которых характерен для процессоров Ге]. Что- 
бы различать эти две пары процедур, процедуры для вычисления дополнения и мо- 
дуля числа размером № байтов с порядком следования байтов, отличным от [пее1, 
мы назвали реверсивными. 


Вычисление дополнения числа размером М байтов 
и 


ее ---- + 
:| Порядок — старший байт по младшему адресу (не пбе]) | 
а --+-------- + 
са1с_сотрТетете_г ргос 

дес сх 

оу $1. сх 

пед уе рёг [Ьх3[$1] —: дополнение первого байта 


стр Буте рЕг [6х][$1].0 ; операнд = 0 — особый случай 
3пе 5ЙогЕ $+3 


$1с : установить СР. так как перенос 
9сх2 @@ехл+ сус1 ; для однозначного числа 
@@сус1 : дес $1 


по рубе рёг [6х][$13 
ас уе рег [6х $11.0 
Тоор @@сус1 

@@ех1&_сус1: ге 

са1с_сотр1етепс_г епар 





30 глава 1. Программирование целочисленных арифметических операций 


Для значений размерностью 1/2/4 байта дополнение можно получать с помо- 

щью одной команды МЕС: 
пед орегапа 

Дополнение значений М байтов вычисляет алгоритм, реализованный в про- 
цедуре са<_сотретепЕ г. Обратите внимание, что первый байт может быть нуле- 
вым, поэтому алгоритм учитывает это обстоятельство. Попытка получить его до- 
полнениес помощью команды МЕС обречена на провал. Флаг (Е в этом случае также 
должен устанавливаться программно. Подумайте, почему? 


Вычисление модуля числа размером М байтов 
Е. 


се 

са1с_а6$_г ргос 
фе5* Буе рёг [6х], 801 ; проверяем знак операнда 
Ку. {@@ех1е : число положительное 
са11 са?с_сотрТетелё_г 

@@ехт: ге 

са1с_аб$_г епар 


Для вычислений над операндами, порядок следования байтов которых харак- 
терен для процессоров 1пёе], нам придется разработать еще один вариант процеду- 
ры умножения значений размерностью в произвольное количество байтов. Псев- 
докод и соответствующая ему программа на ассемблере ти\_519п_ММ_1 приведены 
среди файлов, прилагаемых к книге. 


Деление двоичных чисел 


Аналогично операции умножения деление реализуется двумя типами команд — 
учитывающими и не учитывающими знаки операндов. Эти команды накладывают 
ощутимые ограничения на размерность (а соответственно и на диапазон значений) 
операндов. Поэтому мы рассмотрим вначале пример стандартного применения 
команд, после чего займемся реализацией алгоритмов деления чисел произволь- 
ной размерности. 


Программа: Ч1\у ил$19п.азт. Деление без учета знака 
значения размером 2 байта на значение размером 1 байт. 


4-4 ---- + 
дата 

и Чи ? ; делимое 

у [в 2 ; делитель 

м [ее 0 

г [61 0 

.соде 


91\_ип$19п ргос 
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оу ах. и 
Чу у 
:------ сформировать реет 

оу г, ан ; остаток 
пом м. а1 ; частное 
геё 

1 ип$19п епар 

пали: 
са11 01\_ип$10п 

еп@ тали 


Деление чисел большей размерности (4/8 байтов) выполняется аналогично. 
Необходимо заменить директивы ОВ на 0М/00, регистр АХ на ЕАХ/ЕОХ:ЕАХ, регистр 
АЁ на АХ/ЕАХ, регистр АН на ОХ/ЕБХ. 


Деление с учетом знака значения размером 2 байта 
на значение размером 1 байт 


Программа: 41\_$19п.азт. Деление с учетом знака 
значения размером 2 байта на значение размером 1 байт. 





Е В ее Аа ыы а  Иши ыный па ЛЕ ЕЕ + 
а 
и Чи ? ; делимое 
У [1 ? ; делитель 
м [69 0 
г [6 0 
„сое 
ЧУ $191 ргос 
оу ах. и 
1@1у У 
1------ нра результат 
том . ав ; остаток 
оу т а1 ; частное 
------ если нужно получить модуль — уберите знаки комментария 
тому сх. 1 ; длина операнда 
Теа Ьх, м 
са11 са1с_а6$ 
или 
пед м 
ге 
91\_$191 епар 
матп: 
са11 Ом $197 
еп мати 


Деление чисел большей размерности (4/8 байтов) выполняется аналогично. 
Необходимо заменить директивы ОВ на 0М/00, регистр АХ на ЕАХ/ЕРХ:ЕАХ, регистр 
АЁ на АХ/ЕАХ, регистр АН на ВХ/ЕБХ. 


Деление М-байтового беззнакового целого 
на число размером 1 байт 


г Программа: 41% ип$19п_№ 1.а5т. Деление без учета знака | 
:] значения размером № байтов на значение размером 1 байт. ] 
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:| Вход: и — делимое; у — делитель. ] 


ты 
у АБ ? ; делимое 
№=$-и ; длина в байтах значения и 
У [69] 2 : делитель 
м 0 м бр (0) 
г [ет 0 ; остаток 
.соде 
91\ ип$19й_№ 1 ргос 
том г. 0 
хог $1. $1 :4=0 
оу сх. М 
хог 9х. ах 
хог Ьх, Бх 
@@т1 : оу ах, 256 : размер машинного слова 
пы] г ; результат в @х:ах 
тоу Ы. и $1] 
ада ах. Бх 
Оу У 
ее сформировать результат 
оу м[$1]. а1 ; частное 
$Иг ах. В 
оу г. ах ; остаток в г 
тис $1 
10ор  @@т1 
ге 
@1у_ип$1дй_№ 1 епар 
маи: 
са11 Ч1\_ип$19й_ М1 
епа та1п 
Сегмент данных может быть задан, например, так: 
„дата 
и ЧБ 5. 6. 7 ; делимое 
№ =$-ци ; длина в байтах значения и 
у [69] 15 : делитель 
м 95 № аш (0) 
г [ет 0 ; остаток 


В программе м _ип9п_№_1-азт порядок следования байтов делимого неесте- 
ствен для процессора [п{е|. Поэтому среди файлов, прилагаемых к книге, приведен 
вариант программы \_ипюп_М_1_Т.азт, в котором эта проблема устранена. 

Далее при рассмотрении программы деления многобайтовых двоичных чисел 
нам понадобится макрокоманда 4М№_ип$19п_М деления М-байтового беззнакового 
целого на число размером 1 байт (порядок следования байтов не характерен для 
процессоров [П\е|, то есть старший байт находится по младшему адресу). Текст 
макрокоманды приведен среди файлов, прилагаемых к книге. 


Деление (М№+М)-разрядного беззнакового 
целого на число размером М байтов 


// @1\ ип$19п_ММ — программа на псевдоязыке деления 
// (№+М)-разрядного беззнакового целого на число размером № байтов 
// (порядок — старший байт по младшему адресу (не е])) 


Двоичные числа 


// Вход: Ци \ - и=и,..,..+щ\щ — делимое: у=у, ‚-мм, - делитель. м — длина делимого 

// п — длина делителя: Ь-255 “— основание систёны счисления. 

// Выход: 9=4,4, ..--9,9, — частное. г= г„...гуг, — остаток. 

// Ограничения: %,, # 0 08 0; №1. 

ПЕРЕМЕННЫЕ 

1МТ_ВУТЕ и[и+мт]: // делимое размерностью п+т байтов (нумерация от 0 до п+т-1) — 
// дополнительный байт для нормализации 

// байты делимого размещаются. начиная с и+т-Т (старший байт делимого) 

// и заканчивая 0 байтом (младший байт делимого) 


ТМ№ТГ_ВУТЕ [п]: // делитель размерностью п байтов (нумерация от 0 до п-1) 
ТМТ_ВУТЕ м[пн-1]: // пля промежуточных вычислений 

ТАИТ ВУТЕ а[тт7: // частное 

ТТ ВУТЕ г[и]; // остаток 

ТИТ МОКО 99=0: // частичное частное 

ТТ ИОЕО гг=0; // частичный остаток 

ТМТ_ВУТЕ Фетр_г[и]; 

ГМТ_ВУТЕ Боггои=0; // факт заема на шаге 04 

1МТ_ВУТЕ К=0: // перенос 0 < К < 255 

ТМТ ВУТЕ $19п=0: // информация о знаке 


ТАТ_МОВО 6=256: {етр // Б — размер машинного слова 
ТМТ ВУТЕ 0=0, саггу=0. }. пт 
ВООЕ &Р=ТВИЕ 
НАЧ ПРОГ 
// шаг 1 — нормализация: 
9:=Б/(м[и-1]+1) 
ии. 0]: =иичт- 1.04 
м[п-1..0]:=м[п-1..0]*9 
// шаг 2 - начальная установка 3: 
п: 21-Й; ):=0 
@@ту: //шаг 3 -— вычислить частичное частное 94: 
99:=(и[3+п]*5+и[ 3+п-1]) / м[п-1] 
гг:=(и[ +1} *0+и[3+п-1]) Моб у[п-1] 
ДЕЛАТЬ ПОКА &Т 
НАЧ БЛОК_1 
ЕСЛИ (99==Б ОВ а9*\[п-2] > Б*гг+ и[д+п-1]) ТО 
НАЧ БЛОК_2 
99:=99-1 
гг: =гг+У[и-Е] 
ЕСЛИ (гг>Ь) ТО &Е:=РАЕЗЕ 
КОН БЛОК_2 
ИНАЧЕ ЕТ:=РАГЗЕ 
КОН БЛОК_1 
// шаг 4 — умножить и вычесть: 
и 3+1... 3] :=и[)+п..3]-99*\[п-1..0] 
ЕСЛИ (и[3+п..3]<0) ТО // запоминаем факт заема. получаем дополнение 
НАЧ БЛОК_3 
Боггом: =1 
и[ 3+1.) 7:=са]с_сотр]етейе_г(и[3+т..3] ) 
КОН_БЛОК_3 
// шаг 5 — проверка остатка: 
9[31:=99 
ЕСЛИ (Боггом<>1) ТО 
НАЧ БЛОК_4 
// шаг 6 - компенсирующее сложение: 
9(31:= 9[31-1 
и[9+п..3] :=и[3+п..3]+[п-1.0] 
КОН БЛОК 4 


// шаг 7 — цикл по 3: 


3:=]-1 ы 

ЕСЛИ (3>0) ТО ПЕРЕЙТИ НА @@т7 

// шаг 8 — денормализация: 

// вычислим остаток: 
г[п-1...0]:=и(и-1..0]/4 

// 9[м..0] — частное. г[и-1..0] — остаток 
КОН_ПРОГ 
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Программа: @1и ип$19й_№М.а5т. 
Деление (№+М)-байтового беззнакового целого на число размером М байтов. 








Порядок — старший байт по младшему адресу (не ТибеТ). 
Необходимо включить описание процедур и макрокоманд: 
са1с_сотрТетепе г. зи6 $19й_№. ада ип$19и_М№. @1у_ип$19п_М. му _ип$19и_ММ. 








О дык ВЕНЫ ав 6 2 рай ее БС ВОИ Е НЫ Е о абон ыы вы ар + 
и: 
и0 [419] 0 : дополнительный старший байт делимого 
: для нормализации 
у [ И ; делимое 
т=$-и : Алина в байтах значения и 
%0 |1 0 : для компенсирующего сложения Ом, „М.М, 
у [61° ? ; делитель 
п =$-у ; длина в байтах значения у 
т=т-ий 
м [6 м+Т @р (0) :; для промежуточных вычислений 
9 0 пт дир (0) ; частное 
99 м 0 ; частичное частное :99 Ф 0 
гг Ом 0 : частичный остаток 
г Ч п @р (0) ; остаток 
[(] [9] 0 
Тетр [е 0 
фетр_г а п 9 (0) 
Боггом [19 0 : факт заема на шаге 94 
К [ео] 0 ; перенос 0 < К < 255 
Ь [ее 100% : размер машинного слова 
саггу [61°] 0 
.собе 
91\ ип$19п_ ММ  ргос 
: :------ // шаг 01 (1) - нормализация 
хог ах. ах ; 9:=БИС/и-1+1) 
моу 91. у 
тис 91 ма 
тоу ах. Б 
[А 91 
ед 4, а1 : (МН) 
МЫ ип$19_ММ и. м. 9, 1. м; и(ичт..0) :=и(ичт-1..0)%а 
Са 
ризп 95 
рор е5 
Теа $1. м 
Теа 41. иб 
оу сх. п+1 


гер моу$Ь 
м ип519й_ММ у, п, 94. 1. м ;м[п-1..01:=м(и-1..07%*а 


с1а 

рип 95 

рор е5 

]еа $1. м+1 
Теа 91. у 
ОУ сх. п 


гер моу$Ь 
жен -- Шаг 02 — начальная установка 3: пт: =т-п; 3:=тт 


тоу $1. 0 $ И=0 (? п=ичт) 

@@т7: ;------ // шаг 3 — вычислить частичное частное 94 

@@т1 : хог ах. ах ; 99: =Си[ Зичи 9+п-1]) / м"-Ц 
и а1. и0[$1] г гг=(и[ чи чи 9+п-1]) №0 ми-Е 
ми Ь 
$11 еах. 16 
$Ига еах. едх. 16 : результат умножения в еах 
хог едх. еах 


тоу АТ. ич0[$1+] 


Чу ип$19п_ММ 
мати: 


епа та1п 


Двоичные числа 


ааа еах. едх 


$119 ебх. еах, 16 : восстановили пару Чх:ах для деления 
хог Ьх. 6х 
тоу Ы, у ; м->6х 
01 Ьх 
оу 93. ах 
тому гг, ах 
: проверим 
оу ах. 99 ; выполнение неравенства 
стр ах. Б ; 9925 
3е @@т9 : на 99=94-1 
99*\уп-2>5*гг+ид+п-2 
ШИ у+1 : 94-2 
ЮУ {етр. ах ; Ветр=м,..*99 
хог ах, ах 
поу ах. Ь 
ми гг 
хог 9х. ах 
оу 91, ч0[$1+2] 
ада ах. ах 
стр фетр. ах : 99%, > Беги. 
па 6@тЗ п-2 }*п-2 
дес 94 
хог ах. ах 
тоу а]. у 
ада гг, ах 


Эр 
04 //шаг 4 — умножить и вычесть 


ти] _ип$10и_ММ м. п. 994. 1. м ; (3+1. ]:=и(д+1..31-99*\[п-1..0] 


то Ьх, $1 
ризИ $1 
5иБ_$19и_М ибГЬХ]. м. <п+1> ; У<-2и 
дис бет5 ; переход. если нет заема 
; (результат положительный) 
Де Боггом. 1 ; запоминаем факт заема. получаем дополнение 
рор $1 
Теа Ьх, и0[$1] 
тоу сх, п +1 
са1] са1с_сотрТетепе_г 
05 //шаг 5 - проверка остатка 
пом ах. 94 : 9[41:=99 
тоу 9[$1]. а1 
стр Боггом. 1 ; был заем на шаге 4 ? (ЕСЛИ Боггом<>Т ТО) 
зле @@тб 
06 — компенсирующее сложение 
оу Боггом. 0 : аннулируем факт заема 
дес 9($11] : 9(32:= 9(31-1 
тоу Ьх. $1 
рип $1 ; и 3+0..3] :=и(9+0..3]+м(и-1..0] 


294 ип$1дп_М саггу, иО[Ьх]. м0. <п+1> ;перенос не нужен 
07 7/щаг 7 - цикл по 3: 4:=)-1 


рор $1 
Тис $1 В 
стр $1, : ЕСЛИ 1>0 ТО ПЕРЕИТИ НА @@т7 
Ле @@т7 
08 — шаг В — денормализация 
тоу Ьх, $1 : // вычислим остаток: 
91\_ип$19п_М чО[ЬХ). М. 9. г. бетр г ; г[п-1..0):=и[и-1..01/9 
в. : // 9[т..01 - частное, г[п-1..0] - остаток 
епдр 


са11 91 ип$19п_ММ 
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Значения делимого и делителей в сегменте данных могут быть заданы, напри- 


мер, так: 
„Чата 
и0 [6 0 ; дополнительный байт для нормализации 
у а И. ос3Зв. 12и, О ; делимое — 11с312 и 
п=$-и : длина в байтах значения и 
У0 Ф 0 :; для сложения Ом, МУ, 
у [6 Зи. 500 ; делитель — 3150 
п =$-у ; длина в байтах значения у 


ПТ=ш-и 


Программа не работает, если первый байт делителя равен ОЁ®. Сам алгоритм не 
изменяется, а проблема устраняется просто — необходимо лишь в нужных местах 
поменять разрядность операндов. 

Порядок следования байтов делимого неестествен для процессора ше]. Про- 
грамму деления многобайтовых двоичных чисел с порядком следования байтов 
«младший байт по младшему адресу» остается вам в качестве упражнения. 


Двоично-десятичные числа (ВСО-числа) 


Работай постоянно, не почитай работу для себя бедствием 
или бременем и не желай себе за это похвалы и участия. Общее 
благо — вот чего ты должен желать. 


Марк Аврелий 


Понятие о ВСО-числах и элементарных действиях с ними приведены в главе 8 
«Арифметические команды» учебника. В отличие от действий с двоичными чис- 
лами работа с ВСО-числами в процессоре реализована косвенно. В его системе 
команд нет инструкций, которые непосредственно выполняют основные арифме- 
тические действия над ВСО-числами в том виде, как это делается для двоичных 
операндов. Тем более нет средств, которые каким-то образом учитывали бы знак. 
Все это должен делать сам программист. Ниже приведены макрокоманды, кото- 
рые выполняют базовые арифметические операции над ВСО-числами различной 
разрядности. 


Неупакованные ВСО-числа 


Перед тем как приступать к работе с ВСР-числами, необходимо договориться о том, 
как они будут представляться в оперативной памяти — старший байт ВСО-числа 
по старшему адресу или старший байт ВСО-числа по младшему адресу. Изменить 
фрагмент программы для поддержки того или иного способа представления чисел 
не представляет особого труда. Поэтому для однозначности рассуждений выберем 
естественный для процессоров шие! порядок следования байтов — младший байт 
по младшему адресу. 


Сложение неупакованных ВСО-чисел (макрокоманда) 
не - + 


:| Макрокоманда: ада Ьс4 зиттапа 1. Сложение неупакованных ВСО-чисел 
размером 1еп_1 и Теп_2 байтов и помещение результата в $ит. 





Двоично-десятичные числа (ВСО-числа) 


:| Вход: зиттапа 1 и зиттапа 2 - адреса младших байтов слагаемых: | 


1еп_1 и Теп_2 — длины слагаемых в байтах. | 


| Выход: $ит - адрес младшего байта поля суммы. | 
:| Желательно. чтобы это поле имело длину на единицу больше, чем длина ] 
:| самого длинного слагаемого. 


ан --- + 
ад9 Бса пасго  зиптапа 1. 1еп_1. зимтапд_2. 1еп_2. бит 
1оса1 пт. па. м3 
рип $1 
ризИ Ьх 
МОУ ах. 1еп_1 
стр ах. 1еп 2 
па т2 
оу сх. 1еп 1 : длина большего для сложения (см. ниже) 
ризй сх 
оу сх, 1еп2 ; дпина меньшего для сложения (см. ниже) 
ризИ сх 
ту сх, ах 
Теа Ьх. зиттапд_1 : адрес большего источника для сложения 
Теа $1. зимтап 2 ; адрес меньшего источника для тоу$Б 
Эр 3 
02: том сх, 1еп2 ; длина большего для сложения (см. ниже) 
ризИ сх 
поу сх. Теп_1 ; длина меньшего для сложения (см. ниже) 
ризИ сх 
оу сх. 1еп_2 
]еа Ьх. зиттатд_2 —; адрес большего источника для сложения 
Теа $1. эмитапб 1 $; адрес меньшего источника для мом$Ь 
3: ------ заполняем $ит нулями — длина определена выше 
с1а 
хог а1 .а1 
Теа 91. 5ий 
гер $056 
1=----- пересылка меньшего (по длине) ВСО-числа в $ит 
с14 
ри$И 95 
рор е5 
Теа 91. 5ит : адрес источника см. выше 
рор сх ; длина была определена выше 
; и соответствует меньшему ВСО-числу 
гер моу$Ь 
рор сх : цикл по большему 
хог 51551 
м1: Це а1. [6х1[$1] 
адс а1. $т[$1] 
ааа 
ЮУ $и1[$1].а1 
1пС $1 
Тоор м] 
абс $4151], 0 
рор Ьх 
рор $1 


епт 
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Макрокоманда обрабатывает байты, исходя из предположения, что младший 
байт слагаемых находится по младшему адресу. Слагаемые необязательно имеют 
одинаковую длину, но сумма должна иметь размер поля на единицу больше, чем 
длина самого длинного слагаемого. В начале процесса сложения в поле результата 
помещается меньшее (по длине) слагаемое. 


Двоично-десятичные числа (ВСО-числа) 39 


еее - + 
| Вход: и - адрес первого сомножителя. | 
2 1 — длина и. | 
:] у — адрес второго сомножителя. | 
| } - длина м. | 

м — адрес области длиной 1+) байтов для помещения результата. | 


Ь=256 — размерность машинного слова. 


[619] 0 ; перенос 0 < К < 255 
Ь Ом 10 ; основание системы счисления 
соае 
м _6са масго ци. 1. ч. }.м 
1оса!\ по. м, тб 
рип $1 
:------ очистим м 
с14а 
ризН 95 
рор е5 
хог а}. а] 
Леа 1. м 
ЮУ сх. 1+ 
гер $6056 
Ви 
хог Ьх. Бх ; 420..п-1 
тоу сх. 3 
2: риз$И сх : вложенные циклы 
стр У[Ьх]. 0 
де тб 
313 
хог $1. $1 :; 1=0...п-1 
тоу сх. 1 
тоу к. 0 
пд: ПЮМ а1. и[$1] 
пл у[Ьх] 
хог дх. 4х 
ЮУ ОТ, м[6х+$1] 
ада ах. ах 
хог 9х. ах 
ЮУ Ч. К 
ада ах. ах ; (=(ах) - временная переменная 
;------ корректируем результат - "(ан)=цифра переноса (а1)=результат 
аат 
то\у к. ан 
в м[6х+$1]. а1 
15 
тис $1 
100р пм 
тоу а1. к 
ЮУ м[Бх+$1]. а1 
пб: тис Ьх 
рор сх 
100р  п2 
рор $1 
епт 


Нам понадобится и другой вариант этой команды — ти_Ьс4_г, который обра- 
батывает операнды с порядком следования байтов — старший байт по младшему 
адресу. Он приведен среди файлов, прилагаемых к книге. 
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Деление М-байтового беззнакового целого ВСО-числа 
на ВСО-число размером 1 байт (макрокоманда) 








:| Макрокоманда: 91\у Бес 1_г. Деление М-байтового беззнакового целого 

:| ВСО-числа на ВСО-число размером 1 байт. 
еее + 
:| Вход: и — делимое; М — длина делимого. м — делитель | 
еее н------ + 


И пасго и, М, у, м, г 
10са] п 
оу г, 0 
Теа $. 4 $ УЕ 
хог 91. 91 : 3-0 
тоу сх. М 
хог 9х. ах 
хог Ьх. Бх 

т]: ЮУ ап. г 
ПЮМ а1.[$1] 
аад 
Оу У 

1------ сформировать результат 
ОУ [91]. а1 : частное 
тоу г, ап ; остаток 
ТИС $1 
Тис 91 
Тоор м 
у----=- если нужно — получим модуль (уберите знаки комментария) 

Ще сх. М ; Алина операнда 
Теа Ьх. м 


} са11 са1с_а6$_г 
епат 


Деление неупакованных ВСО-чисел 








НЫ Я т АЕ ЕЩЕ рен р ВЫ Бы И о СЫ 5 ася Пе а он Ще ЗелАО а + 
7] Вход: итиии,.м„ — депимое. у=м:у„.м, — делитель. | 
:| Ь=256 — размер машинного слова. | 
еее --- + 
:| Выход: 9=4,4.-.9, - частное. г=гг,.г, — остаток. | 


| Порядок следования байтов — старший байт по младшему адресу (не Ти\еТ) (!) | 
Нужно вставить описание макрокоманд са1с_сотр1етейё_г. ти? _Бс@ г. 
$и6 Ьс9 г. ада Бс9_г, 91\_5с9_1 г. ] 


О и ое ее лы ан а АЛ р а АХ Леа п ай ва О Е ти 4 + 
"ВЫ 
иб [619 0 ; дополнительный байт для нормализации 
и [69 1. 0. 3. 5. 9. 4. 6 : делимое 
ш=$-и ; длина в байтах значения и 
0 [ее 0 : для сложения Ом,м,..\, 
у Фф 5.9. 1 ; делитель 
п=$-м ; Алина в байтах значения у 
т=м-и 
м < м+1 дир (0) ; для промежуточных вычислений 


[9 пт дир (0) ; частное 
0 


[| п бр (0) ; остаток 
ан 10 ; основание системы счисления 





[в 

фетр 
фетр_г 
Боггом 
К 
саггу 
.соде 


:02: 


еб: 


[49 0 

0 0 

95 п @р (0) 
[9 0 

[6 0 

[| 0 

ргос 

01 — нормализация 
хог ах. ах 
тоу 91, у 
тис 9] 

оу ах. Б 
Оу 9] 

ОУ 9. а] 


пи _6са г и. м, 9. 1.м 
с14 


ризй 95 

рор е5 

Теа $1. м 
Теа 91. и0 
тоу сх. т+1 


гер том$Б 
мы _ 69 гу. п. 4. 1. м 
с14 


ри$й 95 

рор е5 

Теа $1. м+1 
Теа 91, у 

оу сх. п 

гер моу$Ь 

тоу 51, 0 

тоу а]. и0[$1] 
стр у, а} 

зле @@тт 

тоу 94. 9 

тр @@т2 

хог ах. ах 
тоу а1. ч0[$1] 
пы Ь 

хог 9х. ах 
тоу 91. и0[$1+1] 
ада ах. ах 
Юм Ы, у 

ту Ы 


тоу 94. а1 
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: факт заема на шаге 04 
:; перенос 0 <= К < 255 


; У 


; 9-5) 


; П=0 


99-5-1 


;У->5х 


проверим выполнение неравенства 


ти] У+1 

ЮУ Тетр. ах 
хог ах. ах 

тоУ а1. и0[$1] 
мы] Ь 

хог едх. едбх 
тоу 91. и0[$1+1] 
ада 9х. ах 

тоу ат. 94 

пы] у 

5иЬ 4х. ах 

хСИ9 Чх. ах 

пи? Ь 

хог Ьх. Ьх 

Не 51. и0[$1+2] 
ада ах. Бх 


стр тетр. ах 


Летр=у2*49 


; еах=д4*у1 
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зпа 6@тз \ 
дес 99 
оу а1 .99 
пр @0т4 
@@т3: :------ 04 
пис гу. п. 99. 1. м 
оу Ьх, $1 
ризй $1 
$и6_Бса г В <п+]>, и. <п+1>. иб[Ьх] : \<->м 
Зтс _ват5 ‹переход. если нет заема 
;(результат положительный) 
оу Боггом. 1 : запоминаем факт заема. получаем дополнение 
рор $1 
------ 05 
(@@т5 оу а1. 94 
том 9[$1]. а1 
стр Бюггои. 1 ; был заем на шаге 04 ? 
Зпе @@тб 
:------ 06 — компенсирующее сложение 
[в Боггом, 0 : сбросим факт заема 
дес 9[$1] 
том Ьх. $1 
ризН $1 
ый уОГЬх]. <п+1>. У0. <п+1>. иб :перенос не нужен 
6@тб: рор $1 
11 $1 
стр $1. Пт 
Ле @@т/ 
1+----= 08 — денормализация 
оу Ьх. $1 
Ч1у са 1 г ио[Ьх}. М. 4. г. Тетр г 
геЕ 
91у 59 Мг еп 
май: 
са11 91мм 65а Мг 
еп@ талп 


Упакованные ВСО-числа 


В отличие от неупакованных ВСО-чисел, разработчики команд процессора Ге! 
весьма сдержанно отнеслись к проблеме обработки упакованных ВСО-чисел. Су- 
ществуют только две команды — БАА и БАб, которые поддерживают процесс сло- 
жения и вычитания упакованных ВСО-чисел. Умножение и деление этих чисел не 
поддерживается вовсе. По этой причине при необходимости выполнения арифме- 
тических вычислений с упакованными ВСО-числами есть смысл предварительно 
преобразовывать их в неупакованное представление, выполнять необходимые дей- 
ствия, результат которых конвертировать (если нужно) обратно в упакованный 
вид. Так как действия по преобразованию не являются основными в процессе вы- 
числений, то желательно, чтобы они были максимально быстрыми. Можно пред- 
ложить много вариантов подобного преобразования. Рассмотрим один из них. 


Преобразование упакованного ВСО-числа размером 
С байтов в неупакованное ВСО-число (макрокоманда) 


Макрокоманда: ВСО_РАСК_ТО ОМРАСК. Преобразование упакованного ВСО-числа 
размером № байтов в неупакованное ВСО-число размером №2 байтов. 
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ее енннннн------ + 
:| Порядок следования байтов — младший байт по младшему адресу (Тпёе1). | 
а а В а а И ее Се а ор Ареса + 
СО РАСК ТО ИМРАСК тасго РАСК. №. ОМРАСК 
оса!  сус1 
ризп 5 
рор е5 
пом есх. М 
с19 ; порядок обработки ВСО-цифр - 


: начиная с младшей 
Теа ед1. ИМРАСК 
]Леа е51. РАСК 


сусТ: хог ах. ах 
10456 : загрузить очередные 2 упакованные 
; ВСО-цифры из РАСК в а1 
гог ах. 4 
гог ан. 4 
$05м 
Тоор Сус] 
епат 


Преобразование неупакованного ВСО-числа размером 
ы байтов в упакованное ВСО-число (макрокоманда) 


"| Макрокоманда: ВСО_ЦУМРАСК_ТО_РАСК. Преобразование неупакованного ВСО-числа | 
:| размером № байтов в упакованное ВСО-число. 


| Порядок следования байтов — младший байт по младшему адресу (Тпёе]). | 
аа Ее Зе а Ыб ее Ее ый и Бе + 
СО МРАСК ТО РАСК тасго УМРАСК, М. РАСК 

Ё0са!\  сус1 

рип 95 

рор е5 

оу есх. М 

1+----- определяем №2 (размерность РАСК) — ебСпи нечетное. 
я округляем в большую сторону 

Уйг есх, 1 ; делим на 2 

ы есх. 0 

К [ы $+4 

5ефс ы 

1пс есх ; добавляем 1 для округления вверх 
; предыдущие три команды можно 
; заменить одной: а@с есх. 0 
: теперь в есх правильное значение 
; счетчика цикла в соответствии 
; с размерностью УМРАСК 

с1а ; порядок обработки ВСО-цифр — 
; начиная с младшей 

Теа е1. РАСК 

Теа е51. ИМРАСК 

сусТ: хог ах. ах 

1095м ; загрузить очередные 2 неупакованные 
: ВСО-цифры из ИМРАСК в ах 

го] ап. 4 

го] ах. 4 

$1056 

Тоор сус1 

{е5+ ыы, ы 

и] 7 $+7 


апа Бе рг [е91-1]. обв 
епт 
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Генерация последовательности 
случайных чисел 


Знание некоторых принципов нередко 
возмещает незнание некоторых фактов. 


К. Гельвецкий 


Важный класс вычислительных алгоритмов, востребованных на практике, — алго- 
ритмы генерации последовательности случайных величин. По определению, по- 
следовательностью случайных чисел является последовательно формируемый мас- 
сив значений, в котором каждый очередной элемент получен вне всякой связи 
с другими его элементами и появление этого элемента возможно с вероятностью, 
подчиненной некоторому закону распределения. Если появление любого числа 
в этой последовательности равновероятно, то говорят о равномерном законе рас- 
пределения случайных чисел. 

На практике в большинстве случаев применяются программные методы гене- 
рации случайных чисел. На самом деле случайные последовательности, получае- 
мые по некоторому алгоритму, являются псевдослучайными. Это происходит из-за 
того, что связь между значениями в последовательности, образуемой программ- 
ным путем, обычно все-таки существует. Данное обстоятельство приводит к тому, 
что на каком-то этапе генерируемая последовательность чисел начинает повторять- 
ся — «входит в период». Рассмотрим несколько наиболее известных и пригодных 
для практического использования программных методов генерации псевдослучай- 
ных величин (все же, понимая смысл выражения, будем по привычке и для удоб- 
ства называть их случайными). 


Конгруэнтный метод генерации 
последовательности случайных чисел 


Конгруэнтный метод генерации последовательности случайных чисел получил 
широкое распространение. Он описан во многих источниках, но конкретных реко- 
мендаций по его использованию на платформе [1 {е[ автор не встретил. Попытаем- 
ся устранить этот недостаток. 

В основе этого метода генерации последовательности случайных чисел лежит 
понятие конгруэнтности. По определению, два числа А и В конгруэнтны (сравни- 
мы) по модулю М в случае, если существует число К, при котором А — В =К- М,то 
есть если разность А - В делится на М, и числа А и В дают одинаковые остатки от 
деления на М. Например, числа 85 и 5 конгруэнтны по модулю 10, так как при 
делении на 10 дают остаток 5 (при К = 1). В соответствии с этим методом каждое 
число в результирующей последовательности получается исходя из следующего 
соотношения: 

Х..,= (а-Х,+ с) то4 т, где п> 0. 

*При задании начального значения Х., констант а и с, данное соотношение одно- 
значно определяет последовательность целых чисел Х,, составленную из остатков 
от деления на т предыдущих членов последовательности, в соответствии с соот- 
ношением выше. Величина этих чисел не будет превышать значение 77. Если каж- 
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дое число этой последовательности разделить на 7, то получится последователь- 
ность случайных чисел из интервала 0...1. Но не спешите подставлять в показан- 
ное соотношение какие-либо значения. Основная трудность при использовании 
этого метода — подбор компонентов формулы. В зависимости от значения с разли- 
чают два вида конгруэнтного метода — мультипликативный (с = 0) и смешанный 
(с=0). 

Для простоты изложения будем генерировать небольшие по величине случайные 
числа. Это дает возможность легко отслеживать особенности работы рассматривае- 
мых алгоритмов с использованием стандартной возможности перенаправления вво- 
да-вывода. Для этого необходимо, чтобы текст программы содержал строки: 


оу 91. ап 
оу ан. 02 
Юя 21п 


Запуск программы производится командной строкой вида 
ргод.ехе > рАхё 

При этом создается файл р.&%, в который и выводятся результаты работы про- 
граммы. Если отказаться от этой возможности, то вывод будет производиться на 
экран, что не очень удобно для последующего анализа получающейся последова- 
тельности случайных чисел. Более подробно о возможностях работы с файлами 
и экраном читайте материал в главах 5 и 7, посвященных работе с файлами и кон- 
солью из программ на языке ассемблера. 

Большинство представленных ниже программ функционируют в бесконечном 
цикле, с тем чтобы можно было изучать периодичность последовательности, со- 
здаваемой по тому или иному методу генерации случайных чисел. Поэтому для 
окончания работы программы ее необходимо завершить принудительно (при ра- 
боте в УЛп4о\5 для этого можно просто закрыть окно ПОЗ). В результате работы 
программы будет создан файл р.&%, который можно открытьв любом редакторе, 
допускающем просмотр файлов в шестнадцатеричном виде (например во встроен- 
ном редакторе файлового менеджера УЛт4до\из Соттапдег). 

Для увеличения диапазона необходимо внести соответствующие, не принци- 
пиальные с точки зрения алгоритма, изменения в тексты программ. 


Мультипликативный конгруэнтный метод генерации 

последовательности случайных чисел 

Мультипликативный конгруэнтный метод задает последовательность неотрица- 

тельных целых чисел Х, (Х, < т), получаемых по формуле: 

Х,..= (а-Х.) тодт. 
На значения накладываются ограничения: 

и Х, - нечетно; 

Ш а- 577" (р=0, 1,2, ..)илиа=2"+3 (т-= 3, 4, 5, ...) — обе эти записи означают, 
что младшая цифра а при представлении а в восьмеричной системе счисления 
должна быть равна 3 или 5 (проще говоря, остаток от деления а/8 должен быть 
равен 3 или 5); 
т-2'(1>4). 

При соблюдении этих ограничений длина периода будет равна т/4. 
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а ------------ + 
:| Программа: гапд пу] _сопд_1.азт. Генератор линейной (мультипликативной)} | 
:| конгруэнтной последовательности случайных чисел (с=0). | 
еее ен с + 
| Вход: Х,. а, м | 
ен -------- + 
| Выход: @1 — значение очередного случайного числа. | 
а а БЕ Е и до Ад р воре. ео 
о 
м [6 28 
а [6] 11 
х {4 3 ; начальное значение 
соде 
------ первое число в последовательности х=3 
СУСТ: ОУ а1. х ; вычисляем очередное случайное число 
; Х=(а*Х) под т 

п а : ажх в ай:а1 

@1у м ; в ай случайное число 

[Се х. ай 

у------ вывод в файл — командная строка гап@ пи? _сопд.ехе > р. Ех 

оу а1. а 

ОУ ав. 02 

пе 7 

р сус1 
епб_сус1: а 


Если т является степенью 2, как в данном случае, то вместо команды ОМ мож- 
но использовать две команды сдвига. 


ен --- + 
:| Программа: гапа тиу1+_сопд_1.азт. Генератор линейной (мультипликативной) | 
:| конгруэнтной последовательности случайных чисел (с-=0). | 
п -------------- + 
:| Вход: Х,. а, т - в соответствии с указанными ограничениями. ] 
О К И О О ОЕ Е ЕЕ О ИЕ РН + 
_ Выход: 91 — значение очередного случайного числа | 
на -- + 
Сус] 
1-2 вычисляем очередное случайное число Х=(а*Х) то т 
ОМ а]. х 
ЩИ а ; а*х в ай: а] 


$Нга ах. ах. с1 
хог а1. а1 
го] ах. с1 ; ва] случайное число 
14----- вывод в файл —- командная строка гапа пи]Е_сопд.ехе > р.Ех 


Полный пример этой программы (гап4_ти_сопд_2.а5т) вы найдете среди фай- 
лов, прилагаемых к книге. 

Используя эти программы, можно получить последовательность случайных 
чисел, содержащую 32 значения — это ее период. Чтобы увеличить период, необ- 
ходимо каким-либо способом сгенерировать значения а или х, удовлетворяющие 
приведенным выше ограничениям. Так, значение а можно вычислить, используя 


фрагмент: 

„Чата 

Чтутаег [* 1) 8 

.соде 
1------ вычисляем а исходя из соотношения. а пю4 8 = 5 
: одним из способов получить значение а (м>а) 
; удовлетворяем условию а пюд 8 = 5 

2: ОУ а!, а 


хог ап. ай 
91у 91\14ег 
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стр ап, 5 ; остаток равен 5? 
3е т] 
стр аи. 3 : остаток равен 3? 
3е т] 
1пс а 
Эр 2 
#1: : теперь а найдено до конца 


Изменить (увеличить) период можно, корректируя значение т, для чего требу- 
ется исправить соответствующие команды в программах гапд_тий сопд_1.ат и 
гап4_ти _сопд_2.азт, ориентированные на определенную разрядность регистров. 
Существует другая возможность увеличения периода — использование смещан- 
ного конгруэнтного метода генерации последовательности случайных чисел. 


Смешанный конгруэнтный метод генерации 
последовательности случайных чисел 
Соотношение смешанного конгруэнтного метода выглядит так: 
„= (а-Х, + ©) той т, 
гдеп> 0. 
При правильном подборе начальных значений элементов, кроме увеличения 
периода последовательности случайных чисел, уменьшается корреляция (зависи- 


мость) получаемых случайных чисел. 
На значения накладываются ограничения: 


" Х,>0; 

® а-2+ 1, где [> 2; 

* с> 0 взаимно просто с т (это выполнимо, если с — нечетно, а т = 2, гдер> 2); 
" т= 2? (р>2) ит кратно 4. 


: Программа: гап4 п1х_сопд_1.азт. Генератор линейной (смешанной) | 
- конгруэнтной последовательности случайных чисел (с>0). | 


а 
м [ 128 ; 128=27 
а [69] 9 
х [49 3 ; начальное значение 
с Чи 3 
соде 
ОУ 1:7 ; значение степени п = 27 в с1 
у-----= вычисляем очередное случайное число Х=(а*Х) под п. 
; первое число в последовательности х=3 
СУСТ: ЮУ а]. х 
ШИ а ; ах в ав: а1 
ааа ах. с 


го] ах, с1 ; в ай случайное число 
ея вывод в файл — командная строка гап@ т/Лт_сопд.ехе > р.хЕ 


еп@ сус1: ны 
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Величина периода случайной последовательности, получаемой с помощью дан- 
ной программы, составляет 128. Сегмент кода программы гап4_пйх_сопд_1.азт мож- 
но оформить в виде процедуры. Начальное значение Х, можно выбирать двумя 
способами: задавать константой в программе или генерировать случайным обра- 
зом. В последнем случае достаточно опереться на такты системного таймера, как 
в ое макрокоманде: 


О тасго 
ОЕ 70н. а1 
хог а1, а1 
1п а1. 711 ; вводим в регистр АЁ из порта 
: значение ячейки (МОУ 
епт 


Применение — получить значение секунд из СМОЗ для х_ап: 
.соде 


оу а1. (и 
г0м05 
оу х. а] ; х=х $багЕ 


Таким способом можно получить начальное значение из диапазона 0—59. Для 
получения большего по величине начального значения подходит величина разме- 
ром 32 бита из области данных ВТО$ по адресу 0040:006с. Здесь содержится счет- 
чик прерываний от таймера. Извлечь это значение можно при помощи следующе- 
го программного фрагмента: 


рии 45 

руб мога рег 40Н 

рор 05 

ОУ еах. Фиога рЕг 95:006св 
рор 95 


Заменяя команду МОУ командой МОУ АХ, могА рё 45:006сН или МОУ АЕ, Буе ре 
45:006сп, можно использовать младшие 8 или 16 битов значения из этой области 
В1О05. Команда МОМ АЕ, Буе рёг 45:006сН позволяет случайным образом загрузить в 
регистр А! значение из диапазона 0—0. 

При работе под УЛт4о\’з в качестве начального можно использовать значения 


из счетчика меток реального времени Т5С [39]. 

Попытки создать программный датчик случайных чисел без опоры на какие- 
либо теоретические выкладки обречены на провал. Рассмотрим еще несколько 
способов генерации случайных чисел. 


Аддитивный генератор случайных чисел 


Генератор, формирующий очередное случайное число в соответствии с отно- 
шением 
Х.=(Х,+Х, ,) тодт, 


называется аддитивным. 
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В трехтомнике Кнута [5] обсуждаются подобные генераторы и рекомендован 

следующий вариант этой м 
= (Х,„+Х, 55) под т. 

Здесь п > 55,т=2,Х,.. > — произвольные числа, среди которых есть и нечет- 
ные. При этих условиях длина периода последовательности равна 2! - 1 (25 - 1). 

Для генерации первых 55 случайных чисел можно использовать один из рас- 
смотренных выше генераторов. Возьмем датчик линейной (смешанной) конгру- 
энтной последовательности случайных чисел (с > 0). 


еее ненн-- + 
С Программа: гапа а94.азт. Аддитивный генератор случайных чисел. ] 
Е О Ба Ба РО ВИ ай вы БВ а Те Бр ЕЕ БВ БЫ Г о ыы ны д ое ба а Ба ыы ВЕН м а + 
- Вход: Х,. а. с, м. | 
2] случайная последовательность длиной 55 значений. получаемая с помощью | 
:| программы генерации высокослучайных двоичных наборов (гапЧ пих_сопа_1.азт). | 
:| № = 700 - количество элементов в последовательности + 1. | 
ГЕ = 7 — значение степени т = 27 ] 
ен -- + 
:| Выход: 91 — значение очередного случайного числа. ] 
И ее + 
дата 
№ = 700 : число элементов в последовательности + 1 
Е =7 : значение степени п=2” 
Ш [6 128 ; 128 =2 
пт [ен 256 ; 256 = 28 
а [1] 9 
с Фи 3 
х [#15] 3. М дир (0) : массив значений х (начальное значение 
: равно 3) длиной М + 1 
соде 
еяаа далее фрагменты из гапа_п1х_сопйд_1.а5т 
хог $1. $1 
том есх. 54 : счетчик цикла для формирования 
: начальной последовательности 
ОУ а1. х : первое число в последовательности (х=3) 
1------ вычисляем очередное случайное число Х=(а*Х) под т 
СуСТ: и] а ; ажх в ан:а1 
а99 ах. с 
$Иг@ ах. ах, 1 : Е - значение степени п=2” 
хог а]. а1 
го] ах. 1 ; в а! случайное число 
;------ вывод в массив хи в — командная строка 
; гапа тиТ®_сопд.ехе > р.ЁхЕ 
Тис $1 
1) х[$1]. а1 
ое 91. а1 
ОУ ав. 02 
11 211 
Тоор Сус] 
у------ далее продолжаем формирование случайной последовательности. 
; но уже аддитивным методом 
По\ есх. № - 55 
сус12: 1пс $1 
хог 9х. ах 


в а1. х[$1-24] 
ПОМ О1, х[$1-55] 
ада ах. ах 

хог 9х. ах 

91 пт 

пом х[$1]. 91 
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ОУ ан.02 
ТЕ 72 [4] 


Тоор сус12 
ех{: я: 
Судя по результатам, этот метод достаточно хороши. В частности, он неплох тем, 
что позволяет задавать длину последовательности без оглядки на значение т. 
Следующий рассматриваемый нами датчик можно использовать в программах 
на языке ассемблера для получения случайной последовательности 0 и 1. 


Программа генерации высокослучайных 
двоичных наборов 


Для процесса генерации требуются два значения одинаковой размерности — \ и С. 
Значение будет первым в последовательности случайных чисел. Значение 0 играет 
роль маски, в соответствии с которой впоследствии будет производиться опера- 
ция «исключающее ИЛИ». Генерация очередного случайного числа происходит 
в два этапа. На первом этапе значение \ сдвигается влево на один разряд. При этом 
нас интересует содержимое выдвинутого бита. Его значением устанавливается флаг 
СЕ. На втором этапе, если СЕ = 1, корректируем значение\ = У ХОК Си сохраняем \; 
в противном случае сохраняем сдвинутое значение в качестве очередного числа 
последовательности. 


= Программа: гап@ Б1п _1.азт. Генерация высокослучайных двоичных наборов 
| (сокращенный вариант). 





‘о 
у [6] З51 [И 
С [6] ЗЗ1 ; 038 
соде 
Сус]: $1] у. 1 
упс ЩИ 
тоу а}. у 
хог а1. С 
оу у, а1 
1------ вывод на зкран (в файл — командная строка 
я гапа Б1п.ехе > р.&кЕ) 
т]: а 
тр сус1 
еп@ сус1: 


Содержимое файла, в который перенаправлен вывод программы, показывает, 
что период последовательности достаточно удовлетворительный (при удачном 
подборе \ и С). Для того чтобы получить случайную последовательность 0 и 1, не- 
обходимо на каждой итерации выделять младший или старший бит очередного 
значения. Доработаем программу гапд_Ь1п_1.азт, чтобы продемонстрировать этот 
ПИБ 


| Программа: гайд Ь1п_2.азт. Генерация высокослучайных двоичных наборов 
— {полный вариант). 
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й Вход: у. с — в соответствии с указанными выше ограничениями. ] 


:+ ен - + 
дата 
у [@]° 351 ; 
с [6] ЗЗВ ; ОЗВ 
соде 
у у------ получаем очередное значение У 
ри 45 
ризп  мога рёг 40Н 
рор 95 
ОУ еах, Омога рёг 9$:006сп 
рор 95 
ет у. а1 
РЕ аЕ формируем случайные 8-битовые наборы в регистре 0% 
хог 91. 91 
оу есх, 8 
СуС1: $51 У: 1 
пс т] 
оу ат, у 
хог а1. С 
оу у. а1 
тр $+5 ; на $вг 
п]: оу а1. у 
$Иг а. 1 
гс] 91.1 
Тоор Сус] 


о: вывод на экран (в файл — командная строка 
ь гапа_Б1п.ехе > р.&хЕ) очередного значения 


еж: 


Этот датчик хорош, когда его используют для получения одиночных случай- 
ных значений, а не всей последовательности сразу. Поэтому в этой программе от- 
сутствует цикл, характерный для предыдущих программных датчиков, и ее удоб- 
но оформить в виде процедуры или макрокоманды. 

В заключение данной темы — высказывание Джорджа Марсальи, которое при- 
водит Кнут [5]: «Генератор случайных чисел во многом подобен сексу: когда он 
хорош — это прекрасно, когда он плох, все равно приятно». Возможно, экспери- 
ментируя с примерами данного раздела, вы испытали подобное чувство. 

Оценка качества последовательности производится по определенным крите- 
риям, подробное рассмотрение которых не является предметом данной книги, но все 
же требует упоминания. В большинстве случаев для быстрой оценки качества рабо- 
ты генератора случайной последовательности применимы следующие критерии: 


* Длинапериода и длина апериодичности. Под длиной периода понимается длина 
максимальной, не содержащей самой себя, числовой цепочки в последовательно- 
сти случайных чисел. Длина апериодичности — длина подинтервала последо- 
вательности случайных чисел, в пределах которого не встречаются одина- 
ковые значения. 


® Равномерность последовательности псевдослучайных чисел. Этот критерий 
означает вероятность попадания значений, генерируемых датчиком случайных 
чисел, в каждый из т подинтервалов, на которые можно разбить весь интервал 
значений, генерируемых данным датчиком случайных чисел. 
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Стохастичность последовательности псевдослучайных чисел. Этот критерий 
означает определение вероятности появления } единиц (нулей) в определен- 
ных и разрядах генерируемых датчиком случайных чисел. 


Независимость элементов псевдослучайной последовательности. Критерий 
определяет степень корреляции (зависимости) двух случайных величин в сге- 
нерированной последовательности. При проведении оценки на основе данного 
критерия можно рассматривать любые, а не только рядом стоящие случайные 
величины последовательности. 


Более подробную информацию о подходах к оценке случайных последователь- 
ностей можно получить в литературе [5]. 


Глава 2 
Сложные структуры данных 


Сутью искусства программирования обычно 
считается умение составлять операции. Но не менее 
важно умение составлять данные. 


Н. Вирт 


Основные понятия 


Процесс разработки программы на ассемблере традиционно осложняется тем, что 
в этом языке ограничены средства описания данных, привычные для языков про- 
граммирования высокого уровня. В главе 13 «Сложные структуры данных» учеб- 
ника были рассмотрены средства, которые поддерживает ассемблер для работы 
с данными. Но это деление весьма условно и не дает представления о том, как реа- 
лизуется общая концепция понятий «данные», «тип данных» и «структура дан- 
ных» в контексте программирования на языке ассемблера. Это обстоятельство су- 
щественно влияет на эффективность изучения и использования языка ассемблера. 
Учитывая сложность и практическую важность данного вопроса, есть смысл изло- 
жить его более систематично. 

Проблема представления и организации эффективной работы с данными воз- 
никла одновременно с идеей разработки первой вычислительной машины. Вычис- 
лительная мантина функционирует согласно некоторому алгоритму. А если есть 
алгоритм, то должны быть и данные, с которыми он работает. Аналогично извеч- 
ной дилемме о курице и яйце возникает вопрос о первичности алгоритма и дан- 
ных. Схожий вопрос неявно заложен в название небезызвестной книги Никлауса 
Вирта [4] — «Алгоритмы + структуры данных = программы», два издания которой 
были выпущены издательством «Мир» в 1985 и 1989 годах. 

Что же представляют собой понятия «данные», «тип данных», «структура дан- 
ных»? Попытаемся привести некую классификационную характеристику этих 
понятий. 

Данные — набор байтов, рассматриваемый безотносительно к заложенному в них 
смыслу. Понятие «обработка данных» характерно для процессора как исполни- 
тельного устройства. При этом «данные» рассматриваются как совокупность двоич- 
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ных разрядов, которыми манипулирует определенная машинная команда. Для че- 
ловека подобную интерпретацию вряд ли можно считать удобной. Для него более 
естественной является логическая интерпретация данных, которая базируется на 
понятии «тип данных». 

Тип данных можно определить множеством значений данных и набором опера- 
ций над этими значениями. В учебнике с точки зрения типа данные были разделе- 
ны на две группы — простые и сложные. Данными простого типа считаются эле- 
ментарные, неструктурированные данные, которые могут быть описаны с помощью 
одной из директив резервирования и инициализации памяти. Примером таких 
данных являются целые и вещественные числа различной размерности. В языках 
высокого уровня в качестве простых данных используются еще и данные символь- 
ного, логического, указательного типов. Данные простого типа называют упорядо- 
ценными (или скалярными), так как теоретически можно перечислить все значе- 
ния, которые они могут принять. 

Отличительная особенность данных простого типа — их неструктурирован- 
ность. В контексте конкретной задачи, исходя из смысла и логики обработки меж- 
ду некоторыми простыми данными, могут существовать определенные отношения 
и связи, что позволяет рассматривать их как определенным образом организован- 
ные совокупности. Обобщенное название таких совокупностей — структуры дан- 
ных. В общем случае отдельная структура данных может содержать не только про- 
стые данные, но и другие структуры данных. 

С известной долей условности можно сказать, что тип данных и структура дан- 
ных — понятия, независимые от компьютерной платформы. Вполне можно абст- 
рагироваться от представления в программе данных простого или сложного типа 
и проводить теоретические рассуждения относительно действий с целыми и ве- 
щественными числами, массивами, списками, деревьями и т. д. Поэтому такие 
структуры данных называют структурами данных уровня представления, абстрак- 
тными или логическими структурами. Для машинной обработки абстрактные типы 
и структуры данных необходимо некоторым способом представить в оперативной 
памяти, то есть в виде физической структуры данных (структуры хранения), ко- 
торая, в свою очередь, отражает способ физического представления абстрактных 
данных на конкретной программно-аппаратной платформе. В качестве примера 
можно привести двумерный массив. Для программиста, пишущего программу для 
обработки этого массива, он видится в виде матрицы, содержащей определенное 
количество строк и столбцов. В оперативной памяти данный массив представля- 
ется в виде линейной последовательности ячеек. В данном случае логическая струк- 
тура данных — двумерный массив, а соответствующая ему физическая структу- 
ра — вектор (см. ниже). Таким образом, в большинстве случаев существует различие 
между логическими и соответствующими им физическими структурами данных. 
Задачей программиста фактически является написание кода, осуществляющего 
отображение логической структуры на физическую и наоборот. Этот код реализу- 
ет различные операции логического уровня над структурой данных. Так, на логи- 
ческом уровне доступ к элементу двумерного массива осуществляется указанием 
номеров столбца и строки в матрице, в которой расположен данный элемент. На 
физическом уровне эта операция выглядит по-другому. Для доступа к определен- 
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ному элементу массива программный код по известному номеру строки и столбца 
вычисляет смещение от начального адреса массива в памяти. Исходя из вышепри- 
веденных рассуждений, конкретную структуру данных можно характеризовать ее 
логическим (абстрактным) и физическим (конкретным) представлениями, а так- 
же совокупностью операций на этих уровнях. 

Языкассемблера — язык уровня архитектуры конкретного компьютера. Память 
компьютеров с архитектурой Тп(е! представляет собой упорядоченный набор не- 
посредственно адресуемых машинных ячеек (байтов). Исходя из этого, номенкла- 
тура структур хранения данных архитектурно ограничёна следующим набором: 
скаляр, вектор, список, сеть. 


® Скаляр — поле, содержащее одиночное двоичное значение, размерностью один 
или несколько байтов. Количество байтов, составляющих скаляр, определяет- 
ся допустимыми размерами операндов системы команд конкретного про- 
цессора. 


* Вектор — конечное упорядоченное множество расположенных рядом скаляров 
одного типа, называемых элементами вектора. По сути дела вектор — это одно- 
мерный массив. Что у них общего? Геометрически вектор представляет собой 
состоящий из точек объект в пространстве, имеющий начальную точку, из ко- 
торой он выходит, и конечную точку, в которую он приходит. Точки, лежащие в 
пространстве между начальной и конечной точками (элементы вектора), нахо- 
дятся между собой в единственно возможном отношении — отношении непос- 
редственного следования. Такая строгая упорядоченность элементов вектора 
позволяет произвести их последовательную нумерацию. Аналогично и одно- 
мерный массив имеет началом и концом скаляры, расположенные по опреде- 
ленным адресам памяти. Между этими адресами последовательно расположе- 
ны скаляры, составляющие элементы массива. Определенность с начальным 
и конечным адресами массива, а также с размерностью его элементов дает воз- 
можность однозначно идентифицировать любой его элемент. 


Список — набор элементов, каждый из которых состоит из двух полей. Одно 
поле содержит элемент данных или указатель на элемент данных, другое — 
указатель на следующий элемент списка, который, в свою очередь, тоже может 
быть начальным или промежуточным элементом другого списка. Наличие яв- 
ного указания на упорядоченность элементов списка позволяет достаточно легко 
манипулировать содержимым списка, включая новые и исключая старые эле- 
менты списка без их фактического перемещения в памяти. Это свойство позво- 
ляет размещать в памяти динамически изменяющиеся структуры данных. 


® Сеть — набор элементов, каждый из которых помимо информационного поля 
содержит несколько полей-указателей на другие элементы сети. С помощью сети 
удобно представлять такие структуры данных уровня представления, как де- 
ревья, ориентированные графы ит. п. 


Как мы увидим ниже, эти четыре структуры хранения дают возможность пред- 
ставить в памяти машины практически все известные структуры уровня представ- 
ления: массивы, записи, таблицы, стеки, очереди, деки, списки различной степени 
связности, деревья, ориентированные и неориентированные графы. Эти структу- 
ры можно классифицировать по следующим признакам. 


ЗЕ 
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Связность, то есть отсутствие или наличие явно заданных связей между эле- 
ментами структуры. К несвязным структурам уровня представления относятся 
массивы, символьные строки, стеки, очереди. К связным структурам уровня 
представления относятся связные списки. 


Изменчивость, то есть изменение числа элементов и (или) связей между эле- 
ментами структуры. Поэтому признаку структуры делятся на статические (мас- 
сивы, таблицы), полустатические (стеки, очереди, деки) и динамические (одно-, 
двух- и многосвязные списки). 


Упорядоченность — линейные (массивы, символьные строки, стеки, очереди, 
одно- и двухсвязные списки) и нелинейные (многосвязные списки, древовид- 


ные и графовые структуры). 


Отображение структур представления в структуры хранения производится в со- 
ответствии с требованиями конкретной задачи и в зависимости от требований по- 
следней может производиться разными способами. В ходе дальнейшего изложения 
мы выясним возможности, которыми обладает язык ассемблера для представле- 
ния и программной обработки наиболее полезных и часто используемых на прак- 
тике структур представления (абстрактных типов данных). 


Способы распределения памяти 


Прежде чем приступить к рассмотрению того, каким образом поддерживается ра- 
бота с различными структурами данных на ассемблере, необходимо определиться 
с тем, как будет решаться проблема распределения памяти. Это важный момент, 
так как фон-неймановская архитектура современных машин предполагает, что 
любые данные, обрабатываемые программой, располагаются в памяти. Традици- 
онно в любом языке программирования высокого уровня существуют два способа 
распределения памяти для переменных и постоянных данных — статический и 
динамический. Соответственно данные будем называть статическими и динами- 
ческими объектами данных. В ассемблере в силу его специфики явно присутствует 
возможность только статического распределения памяти с помощью директив ре- 
зервирования и инициализации памяти в сегменте данных. Статические объекты 
данных занимают отведенную им память на все время работы программы. До сих 
пор при написании ассемблерных программ мы использовали именно статическое 
распределение памяти. Недостаток этого очевиден — если объект данных занима- 
ет большую область памяти и имеет малый период жизни, то выделять память на 
все время работы программы неразумно. Гораздо эффективнее в таких случаях 
иметь возможность для временного выделения памяти объекту данных на период 
его жизни. В этом разделе мы уделим все внимание проблеме динамического рас- 
пределения памяти в программах на ассемблере. 

Динамическими объектами данных называются объекты данных, обладающие 
двумя особенностями: 

распределение/освобождение памяти для объекта данных производится по яв- 

ному запросу программы; 

доступ к динамическим объектам данных производится не по их именам, а по- 

средством указателей, содержащих ссылку (адрес) на созданный динамичес- 

кий объект. 
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Существует и третья особенность, о которой, возможно, не подозревают про- 
граммирующие на языках высокого уровня, — технология выделения памяти для 
динамических объектов данных. Эта технология напрямую зависит от операцион- 
ной среды, для которой разрабатывается программа. Так, в М5 ОО$ динамическое 
выделение памяти во время работы приложения осуществляется с помощью двух 
функций прерывания ше 211: 48В (выделение блока памяти) и 49} (освобождение 
блока памяти). Единицей выделения памяти при этом является параграф (16-бай- 
товый блок памяти). С точки зрения современного программирования — это при- 
митивно и не очень интересно. Гораздо болыпими возможностями обладает наи- 
более распространенная в настоящее время операционная система \Йп4о\5. 

В Мт4до\з существуют несколько механизмов динамического выделения па- 
мяти: 


* виртуальная память; 
” кучи; 
отображаемые в память файлы. 


Пример использования последнего из перечисленных механизмов рассматри- 
вается в главе 7 этой книги, посвященной работе с файлами. Для нашего изложе- 
ния представляют интерес, хотя и в разной степени, первые два механизма. 


Механизм виртуальной памяти МЛпдом$ 


Механизм виртуальной памяти УЛ о\з реализуется с помощью функций АРТ 
\т32 Утиа АПос и Мйиа[Егее. 


[РУОТО Узгсиа1АПос(ЕРУОТО ТрАдагез$, $12Е_Т @мб12е. [ОВО ТТАТТоса1опТуре. 
ОмОкО Е1Рготесе) 
ВООЕ У1геиа1Егее(ЕРУОТО ТрАдагез$. $Т12Е_Т @иб12е. ОМОВО дмЁгееТуре) 


С помощью функции Уна Ас приложение запрашивает в свое распоряже- 
ние область памяти (регион) в адресном пространстве с размером, указываемым 
параметром @м1е. Величина 4м512е должна быть кратна 64 Кбайт, что, соответ- 
ственно, является минимальным размером региона. Динамическое выделение па- 
мяти такими большими порциями может требоваться лишь для работы с больши- 
ми массивами данных (структурами данных). Для нашего изложения этот способ 
выделения данных не подходит. Отметим лишь, что работа функции УтнайАЦос 
имеет следующую особенность. Имеются три варианта обращения к функции 
Упиа!АЦос: резервирование региона в адресном пространстве процесса; выделение 
физической памяти в зарезервированном предыдущим вызовом функции МпнаАЦос 
регионе; резервирование региона с одновременной передачей ему физической памя- 
ти. Освобождение региона производится функцией Уна гее. Более подробную 
информацию о параметрах функций Ущна[Айос и Уна тее можно посмотреть 
в документации МОМ. 


Механизм работы с кучами УМ/Лтдом/$ 


Этот механизм наиболее эффективен для поддержки работы с такими структура- 
ми данных, как связные списки, деревья и т. п. Как правило, отдельные элементы 
этих структур имеют небольшой размер, в то время как общее количество памяти, 
занимаемое такими структурами в разные моменты времени работы приложения, 
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может быть разным. Главное преимущество использования кучи — свобода в оп- 
ределении размера выделяемой памяти. В то же время это самый медленный меха- 
низм динамического выделения памяти. 

М/тдо\з поддерживает работу с двумя видами куч: стандартной и дополни- 
тельной. 

Во время инициализации процесса система выделяет ему стандартную кучу 
(или кучу по умолчанию), размер которой составляет 1 Мбайт. При желании мож- 
но указать компоновщику ключ /НЕАР с новой величиной размера стандартной кучи. 
Создание и уничтожение стандартной кучи производится системой, поэтому в АР 
несуществует функций, управляющих этим процессом. Только одна функция дол- 
жна вызываться перед началом работы со стандартной кучей — бе{Ргосез$Неар: 
НАМОСЕ бефрРгосе$$Неар(\0Т) 

бе{Ргосез$Неар возвращает описатель, используемый далее другими функция- 
ми работы с кучей. 

Для более эффективного управления памятью и локализации структур хране- 
ния в адресном пространстве процесса предусмотрено создание дополнительных 
куч. Сделать это можно с использованием функции НеарСгеа{е: 

НАМОЕЕ НеарСгеате(ОМОВО #1ОрЕ1от$. $12Е_Т @м1п111а1$12е. $17Е_Т @иМахлтит$12е) 

Размер создаваемой этой функцией кучи определяется параметрами 91 па е 
{начальный размер) и 9\Махитит1е (максимальный размер). Возвращаемое фун- 
кцией НеарСгеае значение — описатель кучи, который используется затем други- 
ми функциями, работающими с данной кучей. Уничтожение дополнительной кучи 
осуществляется вызовом функции НеарОезоу, которой в качестве параметра пе- 
редается описатель уничтожаемой кучи: 

ВООЕ Неарбезсгоу(НАЮОЦЕ ПНеар) 

Важно отметить, что на этапе создания как стандартной, так и дополнительных 
куч реального выделения памяти для них не производится. Главное — получить 
указатель и сообщить системе характеристики и размер создаваемой кучи. 

После получения описателя работа со стандартной и дополнительной кучами 
осуществляется с помощью функций НеарАЦос, НеарКеА|Цос, Неар$1те, НеарЕгее. Рас- 
смотрим их подробнее. 

Выделение физической памяти из кучи производится по запросу НеарАЦос: 
ЕРУОТО НеарА1ТТос(НАМОЕЕ ИНеар. ОМОКО ФмРТадз. $1Е_Т @мВубез) 

Здесь параметр ННеар сообщает НеарАЦос, в пространстве какой кучи требуется 
выделение памяти размером 6мВу{ез байтов. Параметр 9мНад$ представляет собой 
признаки, с помощью которых можно влиять на особенности выделяемой памяти. 
В случае успеха функция НеарАЦос возвращает адрес, который используется далее 
для доступа к физической памяти в выделенном блоке. 

В ходе работы с выделенным блоком может сложиться ситуация, когда необхо- 
димо изменить его размер в большую или меньшую сторону. Для этого предназна- 
чена функция НеарКеА|Цос: 

ЕРМОТО НеарВеАТТос(НАМОЕЕ ННеар. ОмОвО @мР1адз. ГРУОТО ТрМет, $Т2Е_Т аиВуёез) 

Параметр ННеар идентифицирует кучу, в которой изменяется размер блока, а па- 
раметр фМем является адресом блока (полученным ранее с помощью НеарАЦос), 
размер которого изменяется. Новый размер блока указывается параметром 9мВУес. 
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Играя размерами блоков, вы можете совсем запутаться. Функция Неар$12е по- 
может вам определить текущий размер блока по адресу (рМет в куче ВНеар. 
0мОКО Неар$12е(НАМОЕЕ ИНеар. [МОВО дмЕТад$. ЕРСУОТЬ 1рМет) 

И наконец, когда блок по адресу {рМет в куче ВНеар становится ненужным, его 
можно освободить вызовом функции НеарЕгее: 
ВООЕ НеарЕгее(НАМОЕЕ ИНеар. ОМОКО @мЕ1ад$. 1РУОТО Трмет) 

Это минимальный набор функций У/Лт4о\з для работы с кучами. Он столь 
подробно был обсужден нами с целью дальнейшего использования этих функций 
для разработки приложений этого раздела. 


Множество 


Соня закрыла глаза и задремала. Нотут Болванцик 
ее ущипнул, она взвизгнула и проснулась. 

— ..начинается на М, — продолжала она. — Они ри- 
совали мышеловки, математику, множество... Ты когда- 
нибудь видела, как рисуют множество? 

— Множество чего? — спросила Алиса. 

— Ничего, — отвечала Соня. — Просто множество! 

— Не знаю, — начала Алиса, — может... 

— А не знаешь — молчи, — оборвал ее Болвашцик. 


„Льюис Кэрролл. «Алиса в стране чудес» 


Множество как структура уровня представления является совокупностью различ- 
ных объектов, которые могут либо сами являться множествами, либо являться 
неделимыми элементами, называемыми атомами. 

Множество как структура уровня хранения реализуется двумя способами: 


и простым — в виде данных перечислимого типа; в языках высокого уровня этот 
тип данных реализуют с помощью типа «множество» (в Ра$са|) или констант 
перечислимого типа (в С); 


сложным — в виде вектора или связного списка. 


Отличие этих двух способов в том, что данные перечислимого типа ограничен- 
но поддерживают понятие множества, представляя собой совокупность объектов, 
которым сопоставлены некоторые значения. При реализации множеств с помощью 
вектора или связного списка становится возможным реализовать именно матема- 
тическое понятие множества, согласно которому над множествами определен ряд 
операций: объединение, пересечение, разность, слияние, вставка (удаление) эле- 
мента и т. д. К данным перечислимого типа эти операции неприменимы. 

В языке ассемблера также есть средства, позволяющие реализовать оба спосо- 
ба представления множеств. Так, описание данных перечислимого типа поддер- 
живаются с помощью директивы епит. Как и в языках высокого уровня, данные 
перечислимого типа, вводимые этой директивой, являются константами, которым 
соответствуют уникальные символические имена. Директива епит имеет следую- 
щий синтаксис: 
синвол_иня епит значение[. значение[. значение...]] 

Здесь значение представляет собой конструкцию символ_имя [=число], а сим- 
вол_имя — любое символическое имя, не совпадающее с ключевыми словами ас- 
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семблера или другими ранее определенными в программе символическими име- 
нами. Следующие примеры описания множеств эквивалентны. 


мееК епит Мопдау. Тиездау. Медпездау. Тпигздау. Ег1дау. Зафигдау. Зипдау 

меек епит Мопдау=0. Тиездау=1. Медпездау=2. Тпиг$дау=3. Ег1дау-4. Зафигдау=5. Зипдау=6 
меек епит Мопдау-0. Тиездау. Иедпез@ау. ТПиг$дау. Ег1дау. Зафигдау. Зипдау 

меек епит $ипдау-6. Мопдау=0. Тиездау. иедпезЧау. ТПигз@ау. Ег1Чау. Зафигдау 


Перечисление элементов множества может занимать несколько строк в про- 
грамме. 

Транслятор будет отводить под размещение каждого элемента множества столь- 
ко байтов, сколько требуется для размещения значения самого большого элемента 
в этом множестве (байт, слово, двойное слово). 

Если при описании очередного элемента множества число в некоторой конст- 
рукции символ_имя [=число] не задано, то транслятор присвоит этому элементу 
множества значение, на единицу большее предыдущего. Если ни одного значения 
не было задано, то первому элементу множества присваивается 0, второму 1 ит. д. 

Работа с элементами множества в программе является завуалированной фор- 
мой использования непосредственного операнда. В этом несложно убедиться, про- 
анализировав листинг трансляции: 


5 :задаем множество: 
6 =0000 =0001 =0002 + меек епит Мопдау. Тиездау. иедпездау. Тпигздау. 


Ег1дау. Забигдау.$ ипдау 
7  =0003 =0004 =0005 + 
8 —=0006 
20 0005 88 0006 тоу ах. ипдау 

Значение символического имени символ_имя, стоящего слева от директивы епит, 
равно количеству битов, необходимому для размещения максимального значения 
элемента справа от директивы епит: 
5 ‚задаем множество: 
6 =0000 =0001 =0002 + меек епит Мопдау. Тиездау. ИедпезЧау. Тпигздау. 
Р1Тдау. Зафигдау. Зипдау 
7  =0003 =0004 -0005 + 
8 -0006 
21 0005 В8 0007 оу ах. меек 

Перед использованием в программе необходимо определить и инициализиро- 
вать экземпляр множества: 
Е меек — меек Забигдау 

Размер этой переменной будет соответствовать размеру максимального элемен- 
та множества мееК. Сказанное иллюстрирует фрагмент листинга: 


5 :‹ задаем множество: 
6 =0000 =0001 =0002 + меек епит Мопдау. Тиездау. Иедпездау. ТПигз@ау. Ег1дау. 
Забигдау. Зипдау 

7  =0003 =0004 =0005 + 

8 -0006 

9 0000 05 $  меек бафигдау 


21 0005 А? 0000г том $. а1 
Хорошо видно, что в данном случае работа с экземпляром множества осуще- 
ствляется как с байтовой переменной. 
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Возможности ассемблера для описания множества и работы с ним сложным 
способом (с помощью векторов и связных списков) будут разъяснены в ходе даль- 
нейшего изложения. 


Массив 


Все истинно великое совершается 
медленным, незаметным ростом. 


Сенека 


Описание массивов 


Как структура представления, массив является упорядоченным множеством эле- 
ментов определенного типа. Упорядоченность массива определяется набором це- 
лых чисел, называемых индексами, которые связываются с каждым элементом 
массива и однозначно конкретизируют его расположение среди других элементов 
массива. Локализация конкретного элемента массива — ключевая задача при раз- 
работке любых алгоритмов, работающих с массивами. Ее сложность прямо зави- 
сит от размерности массива. 

Наиболее просто представляются одномерные массивы. Соответствующая им 
структура хранения — это вектор. Она однозначна и есть не что иное, как просто 
последовательное расположение элементов в памяти. Чтобы локализовать нуж- 
ный элемент одномерного массива, достаточно знать его индекс. Так как ассемб- 
лер не имеет средств для работы с массивом как структурой данных, то для досту- 
па к элементу массива необходимо вычислить его адрес. Для вычисления адреса 
1-го элемента одномерного массива можно использовать формулу: 

А,= АБ+1- (еп. 

Здесь АБ — адрес первого элемента массива размерностью и, 2 — индекс (1 = 0... 
„.п- Г), еп — размер элемента массива в байтах. Процессор поддерживает режи- 
мы адресации, позволяющие легко работать с массивами, размерность элементов 
которых равна 2, 4 и 8 байтов [39]. Заметьте, что при таком определении можно не 
говорить о типе элементов массива. В общем случае они также могут быть струк- 
турированными объектами данных. 

Представление двумерных массивов немного сложнее. Здесь мы имеем случай, 
когда структуры хранения и представления различны. О структуре представления 
говорить излишне — это матрица. Структура хранения остается прежней — век- 
тор. Но теперь его нельзя без специальных оговорок интерпретировать однознач- 
но. Все зависит от того, как решил разработчик программы «вытянуть» массив — 
по строкам или по столбцам. Наиболее естествен порядок расположения элемен- 
тов массива — по строкам. При этом наиболее быстро изменяется последний эле- 
мент индекса. К примеру, рассмотрим представление на логическом уровне дву- 
мерного массива А, размерностью п х т, где 0 <1<п- 1,0<15т- 1: 


ао аз, ах, аз 


ео 
У 


а» а. 22 23 


а а. а.. а. 
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Соответствующее этому массиву физическое представление в памяти — век- 
тор — будет выглядеть так: 

а, а, а, аа, а, а., аза» а», а» аза,, а,, а,, а... 

Номер конкретного элемента массива в этой, уже как бы ставшей линейной, 
последовательности определяется адресной функцией, которая устанавливает по- 
ложение (адрес) в памяти этого элемента исходя из значения его индексов: 

а,-п-1 + }. 

Для вычисления адреса элемента массива в памяти необходимо полученное 
значение умножить на размер элемента и сложить с базовым адресом массива. 

Аналогично осуществляется локализация элементов в массивах большей раз- 
мерности. На рис. 2.1 показан трехмерный массив А,‚, размерностью п х тх К, где 


п=4,т=4,Ё=2. 
дерер=р 


РЕЙ ВН 


(3, 1, 1) 





(4, 1, 1) 
Рис. 2.1. Пример логической структуры трехмерного массива 


Соответствующий этому массиву вектор памяти будет выглядеть так: 


ао а ао а, ау ло ау ао ау, а, а оо о1 10 а, 11 120 а, а, зо а, зи 4200 ал, ао а, а а. 


ао а, ао а, ао а. ау, а. 321 а, а. 331° 

Соответственно номер элемента определяется так: 

а,=п.т.а +т.] +2, 

где0<:<п- 1,05] <т- 1,0521 -1. 

Для вычисления адреса осталось умножить полученное значение на размер эле- 
мента массива и сложить результат с базовым адресом массива. 

Таким образом, преобразование многомерной, в общем случае логической струк- 
туры массива в одномерную физическую структуру производится путем ее линеа- 
ризации по строкам или столбцам. В первом случае быстрее всего изменяется по- 
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следний индекс каждого элемента, во втором — первый индекс. Недостаток опи- 
санного способа локализации элемента массива в том, что процесс вычисления 
адреса подразумевает выполнение операций сложения и умножения. Как извест- 
но, они не являются быстрыми. Существует метод Дж. Айлиффа, с помощью кото- 
рого можно исключить операцию умножения из процесса вычисления индекса. 
Индексация в массиве производится с помощью иерархии дескрипторов, называ- 
емых векторами Айлиффа, так, как это показано на рис. 2.2. На этом рисунке], 
обозначают соответственно первый, второй и третий индексы массива. 


Физическая структура трехмерного массива 
(4:4, —1:1, 0:1) 


Дескриптор, Вектор Айлиффа 
описывающий массив В первого уровня 





Рис. 2.2. Представление предыдущего трехмерного массиаа по методу Айлиффа 


Из рисунка видно, что основной дескриптор массива содержит указатель на 
вектор Айлиффа первого уровня. Вектор первого уровня является единственным 
и содержит указатели векторов Айлиффа следующего уровня. То есть иерархия 
дескрипторов однозначно отражает размерность массива. Локализовать нужный 
элемент массива можно, руководствуясь его индексом логического уровня. Для 
этого нужно пройти по цепочке от основного дескриптора через соответствующие 
элементы векторов Айлиффа, извлекая из них и суммируя значения смещений 
с базовым адресом массива: 

Адрес (В(7,,)»› ...),)) = (..(Р) +) +1) +...-+1,). 

Здесь (О) — значение указателя вектора Айлиффа первого уровня, хранящееся 
в основном дескрипторе. При необходимости никто не мешает вам разместить 
в элементах векторов Айлиффа и другую служебную информацию, например диа- 
пазон иэменения соответствующего индекса. Очевидный недостаток метода Ай- 
лиффа — увеличение общего объема памяти для структуры хранения многомер- 
ного массива в памяти. 

Что касается описания массива в программе на ассемблере, то его варианты 
были подробно рассмотрены в учебнике. Перечислим их очень конспективно: 
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перечисление элементов массива в поле операндов одной из директив описа- 
ния данных; 


резервирование памяти для элементов массива с использованием оператора 
повторения дир (элементы массива формируются динамически в ходе выпол- 
нения программы); 


использование директив ЦаБе! и гер!. 


После рассмотрения возможностей по динамическому выделению памяти в опе- 
рационных средах М$ ОО$ и УЛша4о\$ можно к перечисленным трем вариантам 
добавить еще один — динамическое распределение памяти. Применительно к про- 
граммированию для \У/т4о\з возможности здесь очень широкие и вы вправе ис- 
пользовать наиболее подходящий способ из трех, обсуждавшихся в разделе «Спо- 
собы распределения памяти». 

Массив в разное время работы с ним может изменять свои характеристики — 
имя массива, адрес в памяти первого его элемента, количество и диапазон измене- 
ния индексов, тип элементов, размерность и т. п. В этом случае имеет смысл его 
физическое представление в памяти предварять специальным заголовком, или 
дескриптором, в котором указывать характеристики массива, чтобы программа 
могла правильно обрабатывать элементы массива. Особенно это важно, когда па- 
мять для массива выделяется динамически. 

Приемы практической работы с массивами продемонстрируем на примерах 
выполнения конкретных операций: сортировка массива, поиск в массиве, транс- 
понирование матрицы и др. На примере работы с массивами очень удобно обсуж- 
дать особенности реализации этих операций, так как в общем случае элементы 
массива могут быть не просто скалярами, но и более сложными по структуре дан- 
ными. Поэтому дальнейшее наше изложение, помимо демонстрации приемов ра- 
боты с массивами в программах на ассемблере, будет посвящено рассмотрению 
возможных подходов к реализации нескольких классов важных на практике алго- 
ритмов. 


Сортировка массивов 


Под сортировкой понимается процесс перестановки элементов некоторого мно- 
жества в порядке убывания или возрастания. Если элементы множества — скаля- 
ры, то сортировка ведется относительно их значений. Если элементы множества — 
структуры, то каждая структура должна иметь поле (поля), относительно которо- 
го будет производиться упорядочивание местоположения элементов (то есть сор- 
тировка) относительно других элементов-структур множества. 

Различают два типа алгоритмов сортировки: сортировку массивов и сортиров- 
ку файлов. Другое их название — алгоритмы внутренней и внешней сортировки. 
Разница заключается в местонахождении упорядочиваемых объектов: для внут- 
ренней сортировки — это оперативная память компьютера, для внешней — файл. 
В данном разделе будут рассмотрены алгоритмы внутренней сортировки масси- 
вов. Способы внешней сортировки отложим до раздела, посвященного работе 
с файлами. 

Существуют несколько алгоритмов сортировки массивов, которым следует уде- 
лить внимание в контексте изучения ассемблера. По критерию эффективности 
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алгоритмы сортировки массивов делят на простые и улучшенные. Среди простых 
методов, которые также называют сортировками «по месту», мы рассмотрим сле- 


дующие: 

сортировка прямым включением; 
® сортировка прямым выбором; 

# сортировка прямым обменом. 


Улучшенные методы в нашем изложении будут представлены следующими 
алгоритмами: 


*' сортировка Шелла; 
# сортировка с помощью дерева; 
®& быстрая сортировка. 


Сортировка прямым включением 


Идея сортировки прямым включением (программа ргд4_96.а5т) заключается в том, 
что в упорядочиваемой последовательности та$1 длиной п (1= 0...п — 1) последова- 
тельно выбираются элементы начиная со второго (:< 1) и ищутся их позиции в 
уже отсортированной левой части последовательности. При этом поиск места вклю- 
чения очередного элемента х в левой части последовательности таз может закон- 
читься двумя ситуациями: 


найден элемент последовательности таз, для которого та$ < х; 
" достигнут левый конец отсортированной слева последовательности. 


Первая ситуация разрешается тем, что последовательность таз, начиная с та$1, 
раздвигается в правую сторону и на место та$1 перемещается х. Во втором случае 
следует сместить всю последовательность вправо и на место та$0 переместить х. 

Здесь для отслеживания условия окончания просмотра влево отсортирован- 
ной последовательности используется прием «барьера». Суть его в том, что к ис- 
ходной последовательности слева добавляется фиктивный элемент Х. В начале 
каждого шага просмотра влево отсортированной части массива элемент Хустанав- 
ливается в значение того элемента, для которого будет осуществляться поиск мес- 
та вставки. 


ПРОГРАММА ргд4_96 
// ргд4_96 — программа на псевдоязыке сортировки прямым включением 
// Вход: ма$[п] — неупорядоченная последовательность байтовых двоичных значений. 
// Выход: ма$[п] — упорядоченная последовательность байтовых двоичных значений. 
ПЕРЕМЕННЫЕ. 
МТ ВУТЕ п=8: // количество элементов в сортируемом массиве 
ТТ ВУТЕ ма$[п]: —// сортируемый массив размерностью п (0..п-1) 
Т№Т ВУТЕ Х: —// барьер 
Т№Т ВУТЕ 1=0; 4=0 // индексы 
НАЧГПРОГ 
ДЛЯ 1:=1 ДО п-1 // 1 изменяется в диапазоне 0. .п-1 
НАЧ БЛОК_1 
// присвоение исходных значений для очередного шага 
Х:=та$[1]; та$[0]:=Х: }:=1-1 
ПОКА (Х<та$[3]) ДЕЛАТЬ 
НАЧ БЛОК_2 
и, 51533: 3:=3-1 
КОН_БЛОК 
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та$[3+1]:=Х 
КОН БЛОК 1 
КОН 1 ПРОГ" 


т1: 


Этот Е сортировки не очень экономен, хотя логически он выглядит очень 


естественно. 


[6 44. 55. 12, 42. 94. 18. 06. 67 ; задаем массив 


9 0 : барьер 

ЮУ сх. п -1 ; цикл по 1 

ПЮУ $1. 1 ; 1=2 

присвоение исходных значений для очередного шага 

Ще а]. таз[$1] 

МОУ х. а] : Х:= ма$[1]: ма$[0]:=Х; 1:=1-1 
ризН $1 ; временно сохраним 1. теперь ]=1 


еще один цикл. который перебирает элементы до барьера х=та$[1] 
МОУ а1. та$[$1-1] 


спр х. а] ; сравнить х < та$[1-1] 
да м1 ; если х > ма$[3-1] 
если х < таз[1-1]. то 

оу а1. та$[$1-1] 

ЮУ па$[$1]. а1 

дес $1 

Эпр о 

ЮУ а1. 

ЮУ паз]. а] 

рор $1 

тис $1 

гы сус13 


Сортировка прямым выбором 


Валгоритме сортировки прямым выбором (программа р!д4_99.азт) на каждом шаге 
просмотру подвергается неупорядоченная правая часть массива. В ней ищется оче- 
редной минимальный элемент. Если он найден, то производится его перемещение 
на место крайнего левого элемента несортированной правой части массива. 


ПРОГРАММА ргд4_99 
/! рга4_99 - программа на псевдоязыке сортировки прямым выбором 


Г! Вход: маз[п] 
// Выход: таз[п] 
ПЕРЕМЕННЫЕ 


— неупорядоченная последовательность байтовых двоичных значений. 
— упорядоченная последовательность байтовых двоичных значений. 


Т№Т ВУТЕ п=8; // количество элементов в сортируемом массиве 


Т№Т_ВУТЕ та$[п]: 

Т№Т_ВУТЕ Х: 1=0; 

НАЧ ПРОГ 

ДЛЯ 1:=1 ДО п-1 
НАЧ БЛОК 1 


// сортируемый массив размерностью п (0...п-1) 
]=0; К=0 Ил. }. К — индексы 


// 1 изменяется в диапазоне 1..п-1 


// присвоение исходных значений для очередного шага 
К: =1; Х:= па$[1] 
ДЛЯ ]:=1+1 ДО п // 3 изменяется в диапазоне 1+1..п 
ЕСЛИ та$[1]<Х ТО 
НАЧ БЛОК 2 


к: 


=): х:= та$(1] 
К2 


КОН БЛОК 


Массив 67 


маз[К]:= ма$[1]: ма$[11:=Х 
КОН _БЛОК_1 
КОН | ПРОГ” 


т 
таз 96 4. 55, 12. 42, 94. 18. 06. 67 ; задаем массив 
п= $ - таз 
х [в 0 
К [9 0 
соде 
1--=--- внешний цикл — по 1 
поу сх. п -1 
хог $1. $1 
сус11: ризв сх 
тпоу К. $1 ; К:=1 
ет а1. та$[$1] 
поу х. а1 : Х:=та$[1) 
ризН $1 : временно сохраним 1 — теперь } = [+1 
Тис $1 :]=1+1 
1------ вложенный цикл - по 
оу а1. п 
5иВ ах. $1 
оу сх. ах : число повторов внутреннего цикла по 3 
сусТ2: МОУ а1. та$[$1] 
стр а1. х 
За т] 
в К. $1 : К: =) 
оу а1. та$[$1] 
Ш) х, а] ; х: =та$ [К] 
п: тис $1 = 
Тоор сус12 
рор $1 
МОУ а?. м 
ЮУ а1. 
ЮУ иен. а1 ; маз(К]:=таз[1] 
ЮУ а1. 
оу 551. а1 : па$[1]:=х 
тис $1 
рор 


сх 
Тоор сус11 


Первый вариант сортировки прямым обменом 


Этот метод основан на сравнении и обмене пар соседних элементов до их полного 
упорядочивания (программа ргд4_101.азт). В обиходе этот метод называется ме- 
тодом пузырьковой сортировки. Действительно, если упорядочиваемую последо- 
вательность расположить не слева направо, а сверху вниз («слева» — это «верх»), 
то визуально каждый шаг сортировки будет напоминать всплытие легких (мень- 
ших по значению) пузырьков вверх. 


ПРОГРАММА ргд4_101 

// рга4_101 - программа на псевдоязыке сортировки прямым обменом 1 

// Вход: таз[п] — неупорядоченная последовательность байтовых двоичных значений. 
// Выход: таз[п] — упорядоченная последовательность байтовых двоичных значений. 
ПЕРЕМЕННЫЕ 

1№Т ВУТЕ п=8; // количество элементов в сортируемом массиве 

Г№Т ВУТЕ та$[п]; —// сортируемый массив размерностью п (0. .п-1) 

Т№Т ВУТЕ Х; 1-0; 4-0 11, 4 — индексы 
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НАЧ ПРОГ 
ДЛЯ 1:=1 ДО п-1 // 1 изменяется в диапазоне 1..п-1 
НАЧ БЛОК_1 
ДЛЯ 3:=п-1 ДОВНИЗ 1// } изменяется в диапазоне 1+1..п 
ЕСЛИ та$[3-1]< та$[3] ТО 


НАЧ БЛОК 2 
х:=та$[1-1): па$[3-1]:=та$[)]: та$(9]:=Х 
КОН БЛОК 2 
КОН БЛОК”. 1 
КОН | ПРОГ ` 
ен -- + 


а 
таз [91 4. 55. 12. 42. 94, 18. 06, 67 ; задаем массив 
п= $ - та$ 
х 4 0 
соде 
1----- внешний цикл — по 1 
Ще сх. п-1 
ПЮ\ $1. 1 
сус11: ризН сх 
ОУ сх. п 
5иВ сх. $1 : число повторов внутреннего цикла 
рип 51 : временно сохраним 1 — теперь }=п 
МОУ 51. п -1 
1------ цикл по ) с декрементом п- 1 раз 
сус12: МОУ а1. та$[$1-1] —; ЕСЛИ па$[]-1]< та$[3] ТО 
стр та$[$1]. а] 
За т 
оу х, а1 ; хэта$[]-1) 
поУ а]. па$[$1] 
оу ма$($1-1]. а] ; па$[3-1]= та$[3] 
ЮУ а1. х 
МОУ па$[$1), а! ; па$[3]=х 
т]: дес $1 : 
Тоор сус12 
рор $1 
тис $1 
рор сх 
Тоор сус11 


Второй вариант сортировки прямым обменом 


Эту сортировку называют шейкерной (программа ргд4_104.азт). Она представля- 
ет собой вариант пузырьковой сортировки и предназначена для случая, когда по- 
следовательность почти упорядочена. Отличие шейкерной сортировки от пузырь- 
ковой в том, что на каждой итерации меняется направление очередного прохода; 
слева направо, справа налево. 


ПРОГРАММА ргд4_104 

// ргд94_104 — программа на псевдоязыке сортировки прямым обменом (шейкерной) 

// Вход: та$[п] — неупорядоченная последовательность байтовых двоичных значений. 
// Выход: таз[п] — упорядоченная последовательность байтовых двоичных значений. 
ПЕРЕМЕННЫЕ. 

ТМТ_ВУТЕ п=8; // количество элементов в сортируемом массиве 

ТМТ ВУТЕ та$[п1]: —// сортируемый массив размерностью п (0..п-1) 

ТМГ ВУТЕ Х; 1=0; )=0; г=0; 1=0; К=0 // 1. 3, г, 1, К — индексы 

НАЧ ПРОГ 

1:=0; г:=пй; К:=П 

ПОВТОРИТЬ 


Массив 
ДЛЯ 3:=г ДОВНИЗ 1 // } изменяется от ] дог 
ЕСЛИ па$(1-1]< таз] ТО 
НАЧ БЛОК 1 
х: =та$[3-1]: та$[3-1]:=та$(3]: та$[1]:=Х: К:= 
КОН БЛОК 1 
ДЛЯ ]:=1 ДОВНИЗ г // ] изменяется от г до 1 
ЕСЛИ та$[3-1]< та$[3] ТО 
НАЧ БЛОК_2 
х:=та$[3-1]: ма$(3-1]:=та$[3]: па$(3]:=Х: К:=3 
КОН_БЛОК_2 
г:=К-1 

ПОКА (1>г) 

КОН ПРОГ 
еее - + 
| Программа: рг94_104.азт. Сортировка прямым выбором (шейкерная). ] 

тЫ Е Аа а Е А ры ЕЕ ри ны В и ай + 
ие 

паз Ч 4. 55. 12, 42. 94. 18. 06. 67 ; задаем массив 

п= $ - ма$ 

Хх [3 0 

[В [6 1 

К [6 п 

К [6 п 
соде 

; 1:32; г:=п; К:=й 
14----- ДЛЯ. :=г р 1 
сус13: Ще $1. : 3:=К 
риз$Н $1 
5иВ $1, Ё 
поу сх. $1 : число повторов цикла сус11 
рор $1 
Дес $1 
сус11: Ще а1. та$[$1-1] ; ЕСЛИ ма$[3-1]< ма$[1] Тб 
стр а1. та$[$1] 
па т} 
ЮУ 81. та$[$1-1] 
оу х. а1 ; х:=та$[1-1] 
МОУ а1. тма$[$1] 
в та$[$1-1]. а} : та$Г3-1]:=та$[] 
ЮУ а1. х 
ЮУ па$[$1)., а] ; ма$[3]:=х 
| К. $1 ; К:=] 
м: дес $1 : ]:=]-1 
Тоор сус11 
ЮУ ах, К 
тис ах 
оу Е. ах $ Е:=К+1 
14----- цикл сус12 ый 7 дОвниз г 
е $1. : 3:=- 
поу ах. В 
5иБ ах. | 
пом сх. ах : число повторов цикла сус12 
сус12: оу а]. та$[$1-1] —; ЕСЛИ та$[3-1]< та$[) ТО 
стр а]. та$[$1] 
па 2 
оу а1. ма$[$1-1) 
ЮУ х. а] : Х:=а$[1-1] 
МОУ а1. па$[$1] 
ЮУ па$[$1-1]. а1 ; та$[3-11:=та$[] 
ЮУ а1. х 
ОУ па$[$1], а1 : ма$[3]:=х 
оу К. $1 ; К:=) 
№2: Ша $1 : 4:=+1 


Тоор сус12 
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ЮУ ах. К 

дес ах 

ЮУ В. ах : В:=К-1 
стр Е. ах $ > -? 
Зае $ +5 


Зпр сус13 


Улучшение классических методов сортировки 


Приведенные выше четыре метода сортировки — базовые. Их обычно рассматри- 
вают как основу для последующего обсуждения и совершенствования. Ниже мы 
рассмотрим несколько усовершенствованных методов сортировки, после чего вы 
сможете оценить эффективность их всех. 


Сортировка Шелла 


Приводимый ниже алгоритм сортировки (программа ргд4_107.азт) носит имя ав- 
тора, который предложил его в 1959 году. Суть метода состоит в том, что сорти- 
ровке подвергаются не все подряд элементы последовательности, а только отстоя- 
щие друг от друга на определенном расстоянии й. На каждом шаге значение й 
изменяется, пока не станет (обязательно) равно 1. Важно правильно подобрать зна- 
чения й для каждого шага. От этого зависит скорость работы алгоритма. В каче- 
стве значений й можно использовать следующие числовые последовательности: 
(4,2, 1), (8,4, 2, 1) и даже (7, 5, 3, 1). Последовательности чисел можно вычислять 
аналитически. Так, Кнут предлагает следующие соотношения: 


М. = М+Ь 
в результате получается последовательность смещений: 1, 4, 13, 40, 121... 
Маме Ы 


в результате получается последовательность смещений: 1, 3, 7, 15, 31... 

Подобное аналитическое получение последовательности смещений дает воз- 
можность разрабатывать программу, которая динамически подстраивается под 
конкретный сортируемый массив. 

Отметим, что если й = 1, то алгоритм сортировки Шелла вырождается в сорти- 
ровку прямыми включениями. 

Существуют несколько вариантов алгоритма данной сортировки. Вариант, рас- 
смотренный ниже, основывается на алгоритме, предложенном Кнутом. 


ПРОГРАММА ргд4 107 
/! ргд4_107 — программа на псевдоязыке сортировки Шелла 
// Вход: таз _91$1=(7.5.3.1) —- массив смещений: таз[п] — неупорядоченная 
!/ последовательность байтовых двоичных значений. 
// Выход: таз[п] — упорядоченная последовательность байтовых двоичных значений 
ПЕРЕМЕННЫЕ 
ТАТ ВУТЕ 1=4: // количество элементов в массиве смещений 
ТАТ ВУТЕ паз[п]; // сортируемый массив размерностью п (0. .п-1) 
ТМГ ВУТЕ таз_415[1]=(7.5.3.1); // массив смещений размерностью 1 (0..+-1) 
ТМТ ВУТЕ п=0  // очередное смещение из таз_41$%[1 
МТ ВУТЕ Х; 1=0; 3=0; 5=0  // т. 1. $ - индексы 
НАЧГ ПРОГ 
ДЛЯ $:=0 ДО *-1 
НАЧ БЛОК_1 
В: =1а$_0915%[$] 
ДЛЯ у:=Н ДО п-1 


КОН_ПРОГ” 


та$_415% 
.с0де 
91 


6802: 


6633: 


6694: 


6846: 


@ЗехтЕ: 


НАЧ БЛОК 2 
1:=9-В: Х:=та$[9] 
©6494: 
па$[1+Н]:=та$[1];_1:=1-И 
ЕСЛИ 1>=0 ТО ПЕРЕЙТИ | НА ©8094 
@@а6: та$[1+р]:=х 
КОН БЛОК_2 

КОН БЛОК 1 


Ч 

п- $ - паз 

96 0 

9 7.5.3.1 
{ = $ - ла$_ 9156 
хог Ьх. 6х 

МОУ сх. Е 

ЮУ 51. 0 

ри$б сх 

оу Ы. маз_091$[$1] : 
1ис $1 

ризй $1 

оу 91. 6х 

стр 91. п-1 
За @@т1 

оу $1, 4 

$иБ 51. 6х 

ЮУ . Па$[41] 
оу х. а! 

ОУ а1. х 

стр а1. ма$[$7) 
дае 084 

ризв 91 

ризв $1 

рор 91 

а99 41. 6х 

пом а1. та$[$1] 
оу маз[91]. а1 
рор [6 

$и6 $1. 6х 

стр 51. 0 

39е @ва4 

ризв 91 

рип $1 

рор 91 

ада 91. Бх 

ЮУ а, х 

оу па$[41). а1 
рор 91 

тис 91 

Зир ©6493 

рор $1 

рор сх 

100р  @@42 


Массив 71 


ЕСЛИ Х>-= таз[1] ТО ПЕРЕЙТИ_НА @846 


4.55, 12. 42, 94. 1В. 06. 67 ; задаем массив 


; задаем массив расстояний 
; число элементов в массиве расстояний 


: цикл по ® (внешний) 
: индекс по таз_915%[] 


в Бх - очередное смещение из таз_91$1[] 


; ДЛЯ з:=Н ДО п-1 

; 91 - это , 1:=+1 — это неявно 

: для нумерации массива с нуля 

: =? 

; конец итерации при очередном таз_41$[] 
: 1:8)-И; $1 - это 1 

; х:=та$[1] 

: х:=1а$Ё4) < 

; ЕСЛИ Х>= та$[1] ТО ПЕРЕЙТИ НА @846 


; $ - ма$[1+Н]: =та$[1]; 1:=1-Н 


1 
: ма$[1+Н] :=та$ [17 
; а$[1+1]:=та$[1] 


= тИ 
; ЕСЛИ 1>=0 ТО ПЕРЕЙТИ_НА ©6044 


; ма$[1+1]:=х 
14 


; па$[1+Н):=х 


3:=)41 
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Сортировка с помощью дерева 


Следующий алгоритм (программа ргд10_229.азт) является улучшением сортировки 
прямым выбором. Автор алгоритма (1964 год) сортировки с помощью дерева — 
Дж. Уильямс. В литературе эта сортировка носит название «пирамидальной». Если 
обсужденные выше сортировки интуитивно понятны, то алгоритм данной сорти- 
ровки необходимо пояснить подробнее. Этот алгоритм предназначен для упоря- 
дочивания последовательности чисел, которые являются отображением в памяти 
дерева специальной структуры — пирамиды. Пирамида — помеченное двоичное 
дерево заданной высоты й, обладающее тремя свойствами: 

® каждая конечная вершина имеет высоту й или й - 1; 


каждая конечная вершина высоты й находится слева от любой конечной вер- 
шины высоты й — 1; 


@ метка любой вершины больше метки любой следующей за ней вершины. 


На рис. 2.3 изображено несколько деревьев, из которых лишь одно — Т4 — яв- 
ляется пирамидой. 


27 


20 3 





Рис. 2.3. Примеры деревьев (Т4 — пирамида) 


Такая структура пирамид позволяет компактно располагать их в памяти. На- 
пример, пирамида, показанная на рисунке, в памяти будет представлена следую- 
щим массивом: 27, 9, 14, 8, 5, 11, 7, 2, 3. Оказывается, что эта последовательность 
чисел легко подвергается сортировке. 

Таким образом, сортировка массива в соответствии с алгоритмом пирамидаль- 
ной сортировки осуществляется в два этапа: на первом этапе массив преобразует- 
ся в отображение пирамиды; на втором выполняется собственно сортировка. Со- 
ответственно, нами должны быть разработаны две процедуры для решения задач 
каждого из этих двух этапов. 


ПРОЦЕДУРА 1пзегЕ_14ет_1п_{гее (1. таз. М) 
// 1тзегё_ет_1п_&гее — процедура на псевдоязыке вставки элемента 
// на свое место в пирамиду 
// Вход: таз[п] - сформированная не до конца пирамида; 1 — номер добавляемого 
// элемента в пирамиду из таз[и] (с конца): п - длина пирамиды 
// Выход: действие — злемент добавлен в пирамиду. 
НАЧ ПРОГ 
3:=1 
@@т1 : К:=2*]; 1:=К+1 
ЕСЛИ (1=<МИ (та$[31<та$[К] ИЛИ ма$[31<та$[1]) ТО ПЕРЕЙТИ НА @@тб 
ИНАЧЕ ПЕРЕЙТИ НА @@т2 
КОН_ЕСЛИ 
@@тб: ЕСЛИ та$[К]>та$[1] ТО ПЕРЕЙТИ_НА @@ 
ИНАЧЕ ПЕРЕЙТИ НА @@т3 
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КОН ЕСЛИ 

вет : х:=та$[3] 
ма$[11:=та$[К} 
}:= 
_ма$[К]:=х 

ПЕРЕИТИ_НА @@т1 

6 @тЗ: х:=та$[3] 
па$[3]:=та$[1] 
па$[1]:=х 


):= 
ПЕРЕЙТИ НА @@т1 
612: ЕСЛИ (К==п И ма$[3]<та$[к]) ТО ПЕРЕЙТИ НА @@л7 
ИНАЧЕ ПЕРЕЙТИ_НА @@т8 
КОН_ЕСЛИ 
ту: х:=та$[3] 
ма$[4]:=та$[п] 
ма$[п]:=х 


ВОЗВРАТ 
КОН ПРОГ 
ПРОГРАММА ргд10_229 
/! рг910_229 - программа на псевдоязыке пирамидальной сортировки 
/! Вход: таз[п] — неупорядоченная последовательность байтовых двоичных значений 
/! Выход: таз[п] - упорядоченная последовательность байтовых двоичных значений. 
ПЕРЕМЕННЫЕ 
Т№Т_ВУТЕ п=16; // число элементов в ма$[] 
МТ ВУТЕ пма$[1]: —// сортируемый массив размерностью п (0..п-1) 


ТТ ВУТЕ Х; /! временная переменная 
Т№Т ВУТЕ 1=0; 3=0; 1-0; К=0; т=0 // индексы 
НАЧ ПРОГ 


7 1:=1/2; 1:=1; №:=И 
// строим пирамиду на основе входного массива 
ДЛЯ к:=1 ДО 1 
НАЧ БЛОК_1 
1изегё_Тет_1и_фгее (1. таз. т) 
1:=1-] 
КОН БЛОК_1 
и! ори ‘пирамиду 
ДЛЯ К:=2 ДО п 
НАЧ БЛОК_1 
х:=а$[1] 
тма$[1]:=та${[тм] 
па$[т]:=х 
п=т-1 
1изеге 1фет_1п_тгее (1. паз. м) 
КОН БЛОК_1 
КОН ПРОГ” 


Е [615] 17п. 05н. 991. ЗН. З31. 71. 131. 270. 7Т 
[618] эн. 69н. 11н. 811, 14. 21. 8 ; задаем массив 


[1 0 : временная переменная 


| Процедура: 1пзегЕ_1фет_1п_Фгее (1. таз. №. ] 


Вход: $1 - номер элемента 1 в последовательности (с конца). 


Глава 2. Сложные структуры данных 


та$ — массив элементов 


т=п/2 — значение. равное ПОЛЬВИНЕ числа элементов массива таз. 


тизег 1бет_1п_$гее ргос 


тд: 


:@@т3: 


@@тЗ: 


рип 
рип 
том 
моу 
том 
$8] 
оу 
тис 
оу 
стр 
да 
ом 
том 
стр 
Зпа 
тс 
стр 
па 
Эр 
условие 
23+1+<М 
обмен с 
оу 
моу 
тс 
стр 
Зпа 
МОУ 
МОУ 
аес 
ет 
моу 
моу 
моу 
моу 
Зир 
моу 
моу 
том 
оу 
моу 
моу 
моу 
Эр 


условие не выполнилось: 
23+1+<М АКС ВИЧ ОВ па$[3]<та$[23+1]) 


моу 
стр 
3пе 
оу 
оу 
стр 
Зае 
оу 
оу 
оу 
оу 
оу 


а1. ма$[$1-1] 
а. К 
ое 


91 
а1. та$[91-1] 
@@тб 


@@т2 
выполнилось ; 


АКМО (та$[3]<та$[23] ОВ та$[3]<та$[23+11]) 


та$[1] 

91, К 

а1. паз[а1-1] 
9 


1 
а!. та$[а1-1] 
@6т3 


а1. паз[$1-1] 
х. а1 

91 

а1. па$[а1-13 
па$[$1-1]. а1 
3. 9 

а1. х 
па$[91-1]. а1 
в@тд 


а1. та$[$1-1] 
х. а} 

а1. та$[91-1] 
ма$[$1-1]. а1 
НОТ 

а1. х 
тма$[а1-1]. а1 
6 т 


ах. 


ат. к 

а1. па$[91-1) 
ма$[$1-1]. а! 
6671 


а1. та$[$1-1] 
х. а1 
ат. п 
а1. ма$[41-1] 
ма$[$1-1]. а! 


: = 
: и >51 


:=2*]; 1:=К+] 


; ах:=та$[3] 


; ах: =та$[К] 


; ма$[К]>та$[1] 
; х:=та$[]] 


: ма$[1]:=та$ [К] 
: = 

; та$[К]:=хХ 
;х:=та$[4] ПЕРЕЙТИ НА @@т1 
; ма$[К] =< та$[1] 

; х:=та$[] 


; ма$[4]:=та$[1] 
= 


; ма$[1]:=х 


а1:=таз[К] 


: ма$[3]<та$[К] 


х:=та$[1] 


; па$[31:=та$[и] 
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поу а1. х 

оу тмаз[91-1]. а1 : таз[п]:=х 
@6т1: рор сх 

рор $1 

геё 


тибегЕ_1Тет_1"_фгее епар 
па1и: 


моу ах. п ; п-1 


оу тм. ах : М: =0 
$Иг ах. 1 
ЮУ ах $ 1: 30\2 
моу 1. ах $ 1:31 
14----- строим пирамиду на основе входного массива 
оу сх. 1 ; Цикл по К:=1..1 
МОУ $1. 1 
@сус]1: МОУ }. $1 
са11 1пеге_1фет 1и_фгее 
дес $1 : 1;:=1-1 


Тоор 6@сус11 
;------ а теперь собственно сортировка: 


тоу сх. п -1 : 1-2 
@@сус12: хог $1. $1 

оу а1. ма$[$1] 

МОУ х. а1 : х:=та$[1] 

оу Ч. т 

оу а!. па$[41-1] 

МОУ та$[$1]. а} ; ма$[1] :=та$ [т 

оу а1. х 

оу ма$[41-1], а1 ; ма$(т]:=х 

ес м 

фпс $1 : 1:=1 


са11 чпзеге Кет_1 п ее 
100ор  @@сус\ё 


ей та?п 


Нахождение медианы 


В этом месте обсуждение примеров реализации на ассемблере методов сортиров- 
ки будет прервано с тем, чтобы обсудить один вспомогательный алгоритм — на- 
хождения медианы числовой последовательности (программа ргд4_123.азт). Его 
применение эффективно в контексте «быстрой сортировки», которая будет рас- 
смотрена нами в следующем разделе. 

Медиана — элемент последовательности, значение которого не больше значе- 
ний одной половины этой последовательности и не меньше значений другой 
половины этой последовательности. Например, медианой последовательности чи- 
сел 38 75 90 65 8 74 43 2 является 38. Соответствующая отсортированная последо- 
вательность будет выглядеть так: 2 5 7 8 38 43 65 74 90. 

Задачу нахождения медианы можно решить просто — предварительно отсор- 
тировать исходный массив и выбрать средний элемент. Но К. Хоор предлагает 
метод, который решает задачу нахождения медианы быстрее и, соответственно, мо- 
жет рассматриваться как вспомогательный для реализации других задач. Досто- 
инство метода К. Хоора заключается в том, что с его помощью можно эффективно 
находить не только медиану, но и значение А-го по величине элемента последова- 
тельности. Например, третьим по величине элементом приведенной выше после- 
довательности будет 7. 
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Значение А-го элемента массива определяется по формуле # = п/2, где п — дли- 
на исходной последовательности чисел. 

Ниже приведена программа ргд4_123.а5т, которая обнаруживает элемент- 
медиану массива. Аналогичную функцию выполняет и имеющаяся среди фай- 
лов, прилагаемых к книге, процедура теФап, которая отличается тем, что ее 
можно вызывать динамически во время работы программы, в которой она ис- 
пользуется. 


ПРОГРАММА ргд4_ 123 
// ргд4_123 — программа на псевдоязыке нахождения К-го по величине элемента 
// массива таз длиною п. Для нахождения медианы К=п/2. 
// Вход: та$[п] — неупорядоченная последовательность двоичных значений: 
// К - номер искомого по величине элемента таз[п]. 
// Выход: х — значение К-го по величине элемента последовательности та$[п]. 
ПЕРЕМЕННЫЕ 
Т№Т_ВУТЕ п; —// длина та$[п] 
ТМТ_ВУТЕ ма$[п]: —// сортируемый массив размерностью п (0. .п-1) 
Т№Т_ВУТЕ Х;4:1=0; 1=0; 1=0; г=0  // д; 1; г - индексы 
НАЧ ПРОГ 
1:=1; г:=й 
ПОКА 1<г ДЕЛАТЬ 
НАЧ БЛОК_1 
х:=а[К]; 1:=1; ):=г 
ПОВТОРИТЬ 
ПОКА а[1]<х ДЕЛАТЬ 1:=1+] 
ПОКА х< а[3) ДЕЛАТЬ 3:=)-1 
ЕСЛИ 1<) ТО 
НАЧ БЛОК_2 
м:=а[1]; а[11:=а[37; а[31:=м 
1:=1+]; ]:=]-1 
КОН БЛОК_2 
ПОКА (1>}) 
ЕСЛИ у<к ТО 1:=1 
ЕСЛИ К<1 ТО г: =] 
КОН БЛОК_1 
КОН_ПРОГ 


р Программа: рг94_123. Поиск К-го элемента массива таз длиною п. ] 
:[ Для нахождения медианы К=п/2. | 


4 нс + 
„ата 
таз а ЗВн. 081. 161. Оби. 791. 761. 571. 241. 561. 028 
45 58. 4Вй. 04й. 701. 451, 478 ; задаем массив 
п = $ - паз 
[в Чи 1 
К [6 п 
К [6 9 
х 96 0 
соде 
+----- проверка. что К=<п-1 
ое ах. п -1 
стр К. ах 
39 ех1ф 
;------ адресация элементов массива с 0 
дес [в 
дес [3 
1------ цикл(1)начало. пока 1<В 
@@т8: оу ах, № 
стр ах, В 


339е ех1Е 
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тоу Ьх. к :; Четр:=та$[К] 
оу а1. та$[Ьх] ; а! — это х 
оу х. а1 
пом $1, Ё $ [:= $1 это 1 
оу Ч. В : 9:=В 91 это 3 
1------ цикл ПОВТОРИТЬ начало 
@т7: стр па$[$1]. а1 ; па$[1]<Еетр? 
Зае @@т3 
7йс $1 
Этр @6л7 
;----- ПОКА х< а[31 ДЕЛАТЬ }:=}-1 
613: стр а1. та$[91] : сетрчта$[1]? 
дзае @@то 
дес [61] 
Эр @@т3 
{@@т5: стр $1. @1 ; ЕСЛИ 1<} ТО 
За @@тб 
;------ если [=<). то обмен та$[1]<->та$[3] 
в) 1. та$[$1] : м:=а[1]: а[1]:=а[3]: а[3]:=и 


хСИ9 па$[91]. 91 
хсп9 а$[$1]. 91 


тис $1 :1:=1+1 
аес 91 : 4:=-1 
1------ цикл(2) конец. пока 1=<) 
@@ тб: стр $1. 91 
39 @@т1 :; За нельзя!!! 
Эр @6л7 
@ 1 : стр 4. К ; ЕСЛИ 3 10 1:= 
33е $ +6 
моу Е. $1 $ [<-1 
стр К. $1 ; ЕСЛИ К<{ ТО г:=) 
3де $+6 
оу К. Ч : В<-3 


тр 668 ; цикл(1) конец 


Быстрая сортировка 


Последний рассматриваемый нами алгоритм (программа ргд10_223.а5т) является 
улучшенным вариантом сортировки прямым обменом. Этот метод разработан 
К. Хоором в 1962 году и назван им «быстрой сортировкой». Эффективность быст- 
рой сортировки зависит от степени упорядоченности исходного массива. Для силь- 
но неупорядоченных массивов — это один из лучших методов сортировки. В худ- 
шем случае, когда исходный массив почти упорядочен, его быстрая сортировка по 
эффективности не намного лучше сортировки прямым обменом. 

Идея метода быстрой сортировки состоит в следующем. Первоначально среди 
элементов сортируемого массива таз[1...и] выбирается один таз[#], относительно 
которого выполняется переупорядочивание остальных элементов по принципу — 
элементы таз[#] < таз[Ё] (:= 0...п — 1) помещаются в левую часть та$; элементы 
таз[#] > таз[А] (1 = 0...и — 1) помещаются в правую часть таз. Далее процедура по- 
вторяется в полученных левой и правой подпоследовательностях и т. д. В конеч- 
ном итоге исходный массив будет правильно отсортирован. В идеальном случае 
элемент таз[А] должен являться медианой последовательности, то есть элементом 
последовательности, значение которого не больше значений одной части и не мень- 
ше значений оставшейся части этой последовательности. Нахождение медианы об- 
суждалось в предыдущем разделе. В следующей программе элементом таз[А] 
является самый левый элемент подпоследовательности. 


78 — Глава 2. Сложные структуры данных 


ПРОГРАММА ргд27_136 
// рг927_136 (по Кнуту) - программа на псевдоязыке «быстрой сортировки» массива. 
/! Вход: маз[п] — неупорядоченная последовательность двоичных значений длиной п. 
// Выход: маз[п] — упорядоченная последовательность двоичных значений длиной п. 
ПЕРЕМЕННЫЕ 
ТМТ ВУТЕ п; — // длина ма$[и] 
ТМТ_ВУТЕ ма$[п]: —// сортируемый массив размерностью п (0. .п-1) 
ТТ _ВУТЕ К: ТЕМР; 1=0; 4=0; 1=0; г=0: // 1. 4, 1. г - индексы 
ТМТ_МОЕО М=1 // длина подпоследовательности. для которой производится 
// сортировка методом прямых включений 
// для отладки возьмем М=1 
НАЧ ПРОГ 
ЕСЛИ М<М ТО ПЕРЕЙТИ НА 49 
1:=1; г:=й 
ВКЛЮЧИТЬ В СТЕК (ОТЕЕГН)// ОРРЕРИ — признак пустого стека 
92: 1:=1; }:5г+1: К:=та$[1] 
93: ЕСЛИ т -1 ТО ПЕРЕЙТИ НА 993 
ПЕРЕЙТИ_НА 44 //итерация прекращена 
943: 1:=1+1 
ЕСЛИ па$[1]<К ТО ПЕРЕЙТИ_НА 93 
94: 4:=]-1 
ЕСЛИ 3<1 ТО ПЕРЕЙТИ НА 45 
ЕСЛИ К<та$[3] ТО ПЕРЕЙТИ НА 44 
ЕСЛИ }>1 ТО ПЕРЕЙТИ НА 96 
// обмен та$[1]:= ма$[91. 
_ТЕМР:=та$[1]; ма$[1]:=та$[3]: ма$[3]:=ТЕМР 
ПЕРЕЙТИ_НА 97 
46: // обмен таз[1]<-> та$[3] 
_ТЕМР:=та$[1]: та$[1]:=та$[3]: ма$[3]:=ТЕМР 
ПЕРЕЙТИ НА 43 
97: ЕСЛИ г-}>3-1>М ТО 
НАЧ БЛОК_1 
о В СТЕК ()+1,г) 
г: =1]- 
ПЕРЕЙТИ НА 92 
КОН _БЛОК_1 
ЕСЛИ 3-1>г-]>М ТО 
НАЧ БЛОК 1 
а В СТЕК (1.5-1) 
=]+ 
ПЕРЕЙТИ НА 92 
КОН_БЛОК_1 
ЕСЛИ г-]>М>3-1 ТО 
НАЧ БЛОК_1 
7:= 3+1 
ПЕРЕЙТИ | НА 92 
КОН БЛОК_1 
ЕСЛИ 3-1>М>г-) ТО 
НАЧ БЛОК_1 
г:=]-1 
ПЕРЕЙТИ НА 42 
КОН БЛОК 1 
ИЗВЛЕЧЬ ИЗ СТЁКА (1.г)_ 
ЕСЛИ г<>0РЕЕН ТО ПЕРЕЙТИ _НА 42 
// далее. если М>1. должен быть фрагмент программы сортировки методом прямых 
// включений (для экономии места опущен) 
КОН_ПРОГ 


2 [618] 501, 08. 52п. 0бн. 90н. 17н. 891. 27. 651. 42и 
[41°] 151. 511. 611. 67Н. 76п. 701 : задаем массив 


42: 


93: 


933: 


94: 


95: 


96: 


97: 


[61 


ЕСЛИ М<М ТО ПЕРЕЙТИ_НА 99 


79 


Массив 


; адресация элементов массива с 0 
; адресация элементов массива до п 
: длина подпоследовательности 


; (для отладки возьмем 1) 


стр М. п 21: г:=й 

Зае 99 ; на шаг 9 

ри$® ОЕЕГР ‚ признак пустого стека 
1:=1; ]:5г+1; К:=та$(1] 

оу $1. Ё ; 1($1):=Ё 

оу а. в 

тис 91 ; 3(91):=г+1 

хог ах. ах 

оу а!. та$[$1] 

ЮУ к, а! =. 

ЕСЛИ 1=<]-1 ТО ПЕРЕЙТИ НА 993 

Ис $1 ; 1:=141 

стр $1. 91 ; 1=<7? 

Ле 993 

аес $1 :; сохраняем 1=<) 

Эр 94 ; ПЕРЕЙТИ НА 44 // итерация прекращена 
тоу а1. К Те я 
стр па$[$1]. а1 : ЕСЛИ та$[1]<К ТО ПЕРЕЙТИ НА 93 
36 93 

дес а1 : ]:=)-1 

стр ат, $1 : 2-1 

3 95 В 

ЕСЛИ К<та$[31 ТО ПЕРЕЙТИ НА 44 

оу а. к 

стр а1. тма$[91] 

3 94 в 

ЕСЛИ 3>1 ТО ПЕРЕИТИ НА, 96 

стр 91. $1 : }=<® 

39е 46 

// обмен та$[1]:= ма$[3] 

моу Ьх. Е 

ОУ 91. та$[Ьх] 

хсв9д па$[91]. 91 

хСН9 па$[Ьх]. @1 я 

пр 97 : ПЕРЕЙТИ НА 97 
та$[1]<-> та$[] 

оу 91. па$[$1] 

хСН9 ма$[41]. 91 

хСП9 ма$[$1]. 91 ,: 

Эр 93 : ПЕРЕЙТИ_НА 43 у 
ЕСЛИ г-]>)-1>М ТО 

тоУ ах. г 

$4Ь ах. 91 ; г-)->ах 

оу Ьх. 91 

$и6 Ьх. 1 : 3-1-2>5х 

стр ах. 6х 5 г->]-1? 

л 97_п\ 

стр Ьх. М : 3-1>М? 

Ле 97 п3 

г-]23-1>М - в стек (3+1,г); г:=)-1; перейти на шаг 42 
ОУ ах. 41 

тс ах 

рии ах 
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ри$п г 
моу г. @1 
дес г 5 г:=)-1 
Эр 42 
97_п\: стр ах. М у г- >? 
39 97_т2 
стр Ьх. М 
Ле 98 
1------ 4. }-1>М>г-] - г:=)-1; перейти на шаг 92 
Ще" г, 91 
бес г 
Эр 92 
97_п3: стр ах. М 
Ле 98 
у------ 3. г-)>М>3-1 - 1:=)*1; перейти на шаг 42 
оу 1. 91 
пс 1 
тр 92 
:------ 2. 3-1>г-]РМ - в стек (1.]-1); 1:=)+1; перейти на шаг 42 
97_м2: рип 1 
оу ах. 91 
тис ах 
рый ах 
ОУ 1. а1 
тис 1 
тр 92 
ыы извлекаем из стека очередную пару (1.г) 
98: рор г _ 
стр г, ОРРЕГИ ЕСЛИ г<>0РЕЕРЬ ТО ПЕРЕЙТИ НА 42 
3е 99 
рор 1 
тр 92 


ЕЕ сортировка методом прямых включений — 

. при М”1 этот шаг можно опустить 

: (что и сделано для экономии места) 
99: а 


Обратите внимание на каскад сравнений шага 47, целью которых является про- 
верка выполнения следующих неравенств: 
® 7-7>]- 1> М- встек (7+ 1,7); т:=7- 1; перейти на шаг 42; 
в 71-1>г-7> М -— встек (1,7 - 1); 1:=7 + 1; перейти на шаг 42; 
а 7-7> М>1-1-—1=7+ 1; перейти на шаг 42; 
 7-1>М>г-у—г=}- 1; перейти на шаг 42. 

Проверка этих неравенств реализуется в виде попарных сравнений, последова- 
тельность которых выглядит так, как показано на рис. 2.4. 

За подробностями алгоритма можно обратиться к тому 3 «Сортировка и по- 
иск» книги Кнута [27]. 





Рис. 2.4. Последовательность сравнений шага 97 
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Существует другой вариант алгоритма этой сортировки — у Вирта в книге «Ал- 
горитмы + структуры данных = программы» [4]. Ноу него используется понятие 
медианы последовательности. На задаче нахождения медианы мы останавлива- 
лись выше. Она интересна еще и тем, что, по сути, является одной из задач поиска, 
рассмотрению которых посвящен следующий раздел. 


Поиск в массивах 


Поиск информации является одной из самых распространенных проблем, с ко- 
торыми сталкивается программист в процессе написания программы. Правиль- 
ное решение задачи поиска для каждого конкретного случая позволяет значи- 
тельно повысить эффективность исполнения программы. Для общего случая 
обычно предполагается, что поиск ведется среди массива записей определен- 
ной структуры. В каждой записи есть уникальное ключевое поле. Абстрагиру- 
ясь, можно сказать, что массив записей — это массив ключевых полей. В этом 
случае задачу поиска в массиве записей можно свести к задаче поиска в масси- 
ве ключевых слов. В этом разделе мы обсудим проблему поиска в массивах и 
пути ее решения. 

-В отличие от методов сортировки, классификация методов поиска не отличает- 
ся особым разнообразием. Уверенно можно сказать, что методы поиска будут раз- 
личными для упорядоченных и неупорядоченных массивов. Неупорядоченными 
массивами здесь считаются массивы, о порядке следования элементов которых 
нельзя сделать никаких предположений. Для таких массивов особых способов по- 
иска нет, кроме как последовательно просматривать все их элементы. В теории 
такой поиск называется линейным. Если элементы массивов каким-то образом 
отсортированы, то речь идет об упорядоченных массивах и для поиска в них суще- 
ствует определенный набор методов. В следующих разделах мы рассмотрим ас- 
семблерную реализацию наиболее интересных методов поиска, применяемых втех 
случаях, когда ключевое поле — некоторое число. Большой интерес представляют 
методы поиска в строке, которые рассматриваются в главе 4. И наконец, существует 
третий класс методов поиска, основанный на арифметическом преобразовании 
исходных ключей — «хэшировании». Эти методы мы рассмотрим в разделе «По- 
иск в таблице». 


Неупорядоченный поиск 


Для выполнения неупорядоченного (линейного) поиска нет определенных мето- 
дов. Чтобы эффективно реализовать эту операцию, необходимо умело использо- 
вать средства языка программирования. Если поиск ведется в массиве чисел (а не 
записей с числовым ключевым полем), то наибольшей эффективности для реали- 
зации линейного поиска в программе на языке ассемблера можно достичь, если 
использовать цепочечные команды. Поэтому мы рассмотрим варианты реализации 
линейного поиска, предполагая, что массив, в котором ведется поиск, на самом 
деле является массивом записей и использование цепочечных команд не представ- 
ляется возможным. Для вставки приведенных ниже фрагментов в свои реальные 
программы вы должны скорректировать соответствующие смещения. 
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Первый вариант неупорядоченного поиска 


Этот вариант программы реализации линейного поиска предполагает обычный 
перебор дотех пор, пока не будет найден нужный элемент или не будут перебраны 
все элементы. 


ПРОГРАММА ргд27_429 

// ргд27_429 — программа на псевдоязыке линейного поиска в массиве (вариант 1). 
// Вход: таз$[п] — неупорядоченная последовательность двоичных значений длиной п; 
{Г К — искомое значение 

// Выход: 1 — позиция в маз[п] (0<1<п-1). соответствующая найденному символу. 
ПЕРЕМЕННЫЕ 

Т№Т_ВУТЕ п: —// длина та$[п] 

ТАТ ВУТЕ тма$[п]; —// массив для поиска размерностью п (0...п-1) 

1№Т_ВУТЕ К: —// искомый злемент 

ТМТ МОВО 1=0 // индекс 


НАЧГПРОГ 
1:=0 

$2: ЕСЛИ (К==та$[1]) ТО-ПЕРЕЙТИ НА _ех 
1:=1+1 


ЕСЛИ (1=<п) ТО ПЕРЕЙТИ_НА $2 
_ех1е: // вывести значение 1 по месту требования 
КОН ПРОГ 


В 
таз [6 50н. ОВп. 52и, Об. 90н. 17н. В9И. 271. 651. 421 
Ге] 151. 51и. 61п. 67Н. 761. 700 ; задаем массив 
п = $ - па$ 
К Фф 158 
соде 
хог $1. $1 : 13651) :=0 
поу а]. К 2 
$2: стр и па$[$1] ; ЕСЛИ К==та$[1] ТО ПЕРЕЙТИ НА _ех1% 
3е о 
тис 51 $ 1:51 в 
стр $. п -1 : ЕСЛИ 1=<п ТО ПЕРЕЙТИ_НА $2 
ЗЬе 52 
; реакция на неудачный результат поиска 
Эр ех1ф 
ОК: ; реакция на удачный результат поиска 
пр ех1® 


Второй вариант неупорядоченного поиска 


Программу первого варианта линейного поиска можно немного усовершенство- 
вать вводом дополнительного элемента — барьера. 


ПРОГРАММА ргд27_430 

/! ргд27_430 — программа на псевдоязыке линейного поиска в массиве {вариант 2). 
// Вход: таз[п] - неупорядоченная последовательность двоичных значений длиной п+1:; 
// К — искомое значение 

// Выход: 1 — позиция в маз[п] (0<1<п-1). соответствующая найденному символу. 
ПЕРЕМЕННЫЕ 

Т№Т ВУТЕ п; —// дпина та$[п] 

Т№Т ВУТЕ па$[п+1]: // массив для поиска размерностью п+1 (0..п) 

МТ ВУТЕ К; // искомый элемент 

ТМГ ОВО 1=0  // индекс 

НАЧ ПРОГ 
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1:=0; па5[п]:=К // установить барьер 
52: ЕСЛИ (К==таз[1]) ТО ПЕРЕЙТИ_НА _ех1® 
1:=1+1; ПЕРЕЙТИ НА $2. 
_еж: ЕСЛИ 1>п ТО ПЕРЕЙТИ_НА ех1®_еггог 
7/ вывести значение 1 по месту требования 
ех1%_еггог: // вывести сообщение об отсутствии элемента 


КОН_ПРОГ 
ен -- + 
:| Программа: рг927_430. Линейный поиск в массиве (вариант 2). | 
о еее ---- + 
„дата 
па$ [| 50и, ОВН. 521. Оби. 901. 178. В9в. 271. 651. 428 
[е] 9) 151. 51й. 61. 671. 761. 701 : задаем массив 
п = $ - паб 
[#19 он : дополнительный зпемент для барьера 
К [#1 151 
соде 
хог $1. $1 
оу а1. к 
оу ма$[п], а1 ; 1:=0; та$[п]:=К // установить барьер 
$2: стр а1. та$[$1] ; ЕСЛИ К==та$[1] ТО ПЕРЕЙТИ_НА _ех1+ 
3е ок 
тис $1 Е 
р $2 : 1:=1+1; ПЕРЕЙТИ НА $2 
ок: стр $1. п ; ЕСЛИ 1>п ТО ПЕРЕИТИ_НА ех1+_еггог 
3е ех1_еггог 
+= реакция на удачный результат поиска 
пр ее 
------ реакция на неудачный результат поиска 
ех {_еггог: : 


Упорядоченный поиск 

На практике массивы элементов (записей) обычно определенным образом упоря- 
дочиваются. Это облегчает задачу поиска в них, так как появляется возможность 
формализации этого процесса. Записи в массиве в зависимости от значений клю- 
чевых полей могут быть отсортированы в числовом или лексикографическом по- 
рядке. 


Двоичный поиск 


Этот вид поиска (программа ргд10_242.азт) предназначен для выполнения поиска 
в упорядоченном массиве (записей), содержащем М№ числовых ключей: А, < &, < 
<... <, Упорядоченный массив чисел 024, 04В, О6Ь, 08, 16В, 245, З8В, 451, 4, 
В, 568, 5ТЬ, 58, 70Б, 76, 79В можно представить в виде двоичного дерева (рис. 2.5). 


Рис. 2.5. Представление массива в виде двоичного дерева 
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Для этого необходимо написать программу, которая в цикле выполняет следу- 
ющие действия. Вначале определяется элемент, расположенный в середине исход- 
ного массива, — он будет вершиной двоичного дерева. Далее в стеке запоминаются 
интервалы ключей подмассивов, расположенных слева и справа от элемента-вер- 
шины двоичного дерева. После этого в цикле происходит извлечение интервалов 
ключей подмассивов из стека, определение серединных элементов в этих подмас- 
сивах, разбиение на очередные подмассивы, запоминание их границ в стеке, из- 
влечение и т. д. В результате будет построено двоичное дерево, подобное изобра- 
женному на рисунке. 

Абстрактно задачу поиска ключа с определенным значением К можно сравнить 
с обходом двоичного дерева начиная с его вершины. Если К меньше значения клю- 
ча вершины, то идем к узлу дерева по левой ветке, если больше — то по правой. 
Значение ключа в очередном узле соответствует среднему элементу подмассива, 
лежащему слева (справа) от элемента, соответствующего вершине дерева. Для сред- 
него элемента подмассива процедура сравнения и принятия решения о переходе 
повторяется. Процесс заканчивается, когда обнаружен узел, ключ которого равен 
К, либо очередной узел является листом, и двигаться больше некуда. 


:| Вход: маз[п] - упорядоченная последовательность двоичных чисел длиной №. | 
: К - искомое значение. | 





паз [9 02н. 041. обр. 081. 160. 24н. 381. 458. 471. 481. 57п 
[49 56. 58п. 70Н. 761, 79Н ; задаем массив 
п = $ - ма$ 

К [9 4 : искомое значение 

.соде 


;------ В $1 и 41 индексы первого и последнего элементов последней 
просматриваемой части последовательности 


оу $1, 0 

оу 9. п -1 

хог ах. ах 

оу а1. К ; искомое значение в ах 

$=---=- проверка на окончание (неуспех): $1>01 

сопё_зеагсий: стр $1. 91 

За ех1{_Ба@ 

ЕВЕ получим центральный индекс 

оу Ьх. $1 

а04 Ьх, 91 

$Иг Ьх. 1 ; делим на 2 

адс Ьх. 0 ; округляем в большую сторону 

стр па5[Ьх]. а1 ; сравниваем с искомым значением 

де ех1{_9004 ; искомое значение найдено 

За @@т1 ; ма$[Ьх]> 

оу $1. Бх ; маз$[Ьх]<К: 

1пс $1 

тр сопё_зеагсй 
@@т1 : оу ат.5х 

дес 91 

пр сопф_зеагсй 


ех1_Баа: пор : вывод сообщения об ошибке 
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ех1_9009: пор : Вывод сообщения об успехе 


Такой подход очень эффективен для поиска в предварительно отсортирован- 
ном массиве (необходимое условие). Другая возможность представления двоич- 
ного дерева — список. В списке каждый узел, кроме уникального ключа, содержит 
информационную часть и ссылки на последующий и, возможно, предыдущий 
элементы списка. Достоинство представления двоичного дерева в таком виде в том, 
что списком достаточно легко описывать дерево, в которое включаются и выключа- 
ются узлы. При представлении двоичного дерева в виде массива это сделать труднее. 
Ниже мы рассмотрим представление деревьев в программах на языке ассемблера. 


Действия с матрицами 


Рассмотренные выше операции над массивами были реализованы исходя из пред- 
положения, что массивы имеют одну размерность. Но существует группа задач, 
в которой работа осуществляется с массивами большей размерности. Прежде все- 
го это действия с матрицами. Кстати, такая структура данных, как сеть (или граф), 
представляется с помощью матрицы [10]. 


Транспонирование прямоугольной матрицы 


Приемы работы с массивами размерностью больше 1 удобно рассматривать на ти- 
повой задаче, например такой, как транспонирование матрицы. 

Суть задачи транспонирования матрицы А = {а,} заключается в замене строк 
столбцами и столбцов строками в соответствии с формулой 4',-а„ где а’, — эле- 
менты транспонированной матрицы /' = {а', 5}. Максимальная величина индексов 1 
и}задается константами т (количество строк) ип (количество столбцов), соответ- 
ственно диапазон их значений составляет: # = 0...т — 1,} = 0...п — 1. Элементы мат- 
рицы определяются статически — в сегменте данных. 

Выше уже отмечалось то, каким образом производится локализация в памяти 
элемента многомерного массива исходя из его логического номера при условии, 
что размерность элементов — 1 байт. Локализация элемента матрицы А относи- 
тельно базового адреса производится по формуле: 


а;=п-1+). 
Соответствующий элемент в транспонируемой матрице будет расположен по 
адресу: 
а;=т.1+). 
Например, рассмотрим матрицу 3 х 4: 


028 04й Оби 088 
161 240 З8В 455 
47н 488 571 560 


Эта матрица в памяти будет выглядеть так: 
021. 041. обл. 08в. 161. 241. 388. 458. 47н. 481. 57Н. 568 


Транспонированный вариант матрицы: 


02н 161 475 
048 240 481 
06 380 578 
08в 451 560 
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Транспонированный вариант матрицы в памяти будет выглядеть следующим 
образом: 
02и. 161. 471. 041. 240. 481. 06. 381. 578. 084, 458. 561 

Для решения задачи «в лоб» по формулам а, = п-{+}иа', -т-1+] требуется 
выделять в памяти область для хранения транспонированной '`матрицы, совпадаю- 
щую по размеру с исходной. 


еее еее антенна + 
:| Программа: рг929_102.азт. Транспонирование матрицы. | 
ен + 

:| Вход: ма$[п] — матрица м х п. | 
еее ееенчанни сс + 

:| Выход: _маз$[п] - транспонированная матрица пх м. | 
а ----- + 
„дата | 
т [6 3 : 1=0...2 
п [6 4 ; 3=0...3 
па$ Ч 02и. 041. 06А —; задаем матрицу 3х4 


6 ОВ. 161. 248 
[е°) 381. 45н., 47н 
[9 481. 571. 560 
$ ма$ = $ - ма 


_та$ [6 $ Маз дир (ОТП) 
фетр [99 0 
сое 
оу сх. п 
хог $1, $1 : 1:=0 | 
м; ризй сх : цикл по 1 
ОУ сх. п 
хог 91. 91 ; 11 =0 
м - локализуем та$1) по формуле: та$14=п*1+] 
т2: оу ах. п 
ЩИ $1 : предполагаем, что результат лишь в ах 
ада ах. 41 : 1*1+] 
Це Ьх. ах 
ОУ 81. маз[Ьх] 
оу фетр. а1 
1------ локализуем местоприенник в та$1) по формуле: _та$1.}=та$31=1*“ 1+) 
оу ах. т 
ЩИ 91 ; предполагаем. что результат лишь в ах 
ада ах. $1 
ОУ Ьх. ах : _Ма$1)=та$31=1* 1+] 
оу 81. фетр 
оу _маз[Ьх]. а] 
1ис 91 ; = 1 
Тор п 
Тис $1 
рор сх ‚восстанавливаем счетчик внешнего цикла 


Тоор м 


Отметим, что для транспонирования прямоугольной матрицы необязательно 
ее моделировать так, как это сделано в предыдущей программе. Кнут приводит 
соотношение, которое позволяет транспонировать матрицу в линейном порядке, 
зная только значения т и и. Для этого используется соотношение, при котором 
значение из ячейки # (для 0<31< М=т-п- 1) исходной матрицы переводится 
в ячейку (т - х) шо4 Мтранспонированной матрицы. Пример программы транспо- 
нирования матрицы в линейном порядке ргд13_3_217.азт присутствует среди фай- 
лов, прилагаемых к книге. 
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Структуры 


Чтобы правильно использовать машину, важно добить- 
ся хорошего понимания структурных отношений, существу- 
ющих между данными, способов представления таких 
структур в машине и методов работы с ними. 


Д. Кнут 


Структура (запись) — конечное упорядоченное множество элементов, в общем 
случае имеющих различный тип. Элементы, входящие в состав структуры, назы- 
вают полями. Каждое поле структуры имеет имя, по которому производится обра- 
щение к содержимому поля. Пример структуры — совокупность сведений о неко- 
тором человеке: номер ИНН, фамилия, имя, отчество, дата рождения, место работы, 
трудовой стаж и т. п. Подробно порядок описания структур и некоторые приемы 
работы с ними описаны в учебнике. Поэтому мы, чтобы не повторяться, рассмот- 
рим те практически важные моменты, которые там были упущены: вложенность 
структур; использование структур для моделирования таблиц и организация ра- 
боты с ними. 


Вложенные структуры 


В общем случае поле структуры само является структурой. Тогда структура пред- 
ставляет собой иерархическую конструкцию, которую можно изобразить в виде 
дерева (рис. 2.6). 


регвоп 
питфег пате $есбоп едисаНоп 


тат  пат рагопуг 
Рис. 2.6. Иерархическая структура сложной записи 


Листы в этом дереве являются той полезной информацией, к которой необхо- 
димо получить доступ. Для этого нужно некоторым образом указать последова- 
тельность идентификаторов, в которой первым идентификатором является имя 
структуры, далее следуют идентификаторы промежуточных узлов и в последнюю 
очередь — идентификатор нужного листа. Но в ассемблере подобная схема реали- 
зована очень ограниченно — можно указать только имена первого и последнего 
идентификаторов (промежуточных попросту нет). Рассмотрим пример. Как обыч- 
но, прежде чем работать со структурой, необходимо задать ее шаблон. Далее для 
работы со структурой в программе необходимо создать ее экземпляр. В листинге 
ниже шаблон структуры называется еетепё, а соответствующий ему экземпляр 
структуры — $1. Отметим лишь, что не стоит искать в приведенных ниже приме- 
рах какой-либо смысл, так как они предназначены только для демонстрации меха- 
низма вложенности структур (и объединений). 
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ТММ [6 0 ; ИНН 
пате Ге] 30 бир (°') ;6.И.0. 

у В1гЕЛдау [6 1962 ; год рождения 
м Б7гЕбау |еь 05 ; месяц рождения 
Ч гПдау [9 30 ; день рождения 
пае1опа1 1+у [в 20 : национальность 

епб$ 
„дата 
$1 е1етепе <> 
сое 


оу. 81. $1.т _БзгЕйдау 


Информацию о дате рождения можно оформить в виде отдельной структуры, 
вложенной в текущую структуру, так, как это сделано в программе ниже: 


ЕЕ $егис 

ТАМ [ее 0 ; ИНН 

10 [19 30 ар ('*°) ; Ф.И.О. 

Уёгис 
у_Ь1гЕлдау 9 1962 : год рождения 
т Багеибау [6 05 ; месяц рождения 
4 Ы1гИдау [е°) 30 : день рождения 
еп4$ 

паЕ1опа11 у Ч 20 ; национальность 
епа$ 

.Чафа 

$1 е1етепЕ <> 

соде 


му а. $1.п ЫЯгеНаау 


Синтаксис ассемблера допускает вынести описание вложенной структуры за 
пределы текущей структуры. При этом можно инициализировать необходимые 
поля структуры МИН дау внутри отдельного экземпляра структуры е(етепе. Но ра- 
ботает такое описание только в режиме ШЕАТ, что и продемонстрировано в про- 
и. 


НОУ ги 
у _В1гЕПаау [6 1962 : год рождения 
м Б1гЕПаау [в 9) 05 ; месяц рождения 
4 Ьагепдау ЧБ 30 ; день рождения 
еп 

еТетепе $гис 

ТАМ 94 0 $ ИНН 

В1гЕйдау $ёгис {т Ь1гИдду-06, 4 У 
110 Ч 30 ар С°) Ф.И.О. 
паф1опа11у Ч 20 : национальность 
еп@$ 

.Чата 

$1 еТетепе <.<>> 

соде 

14еа1 


тоу а1.$1.т Б1гЕПдау 
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Вописание структур допускается вкладывать нетолько описания других струк- 
тур, но и объединений так, как это показано в следующей программе. 


: Программа: рг902_04.азт. Демонстрация взаимного вложения | 
:[ объединений и структур. ] 


ое еее -- + 
ЕТетепе $ёгис 

Тм 94 0 ИНН 

Но [#1] 30 бр (°'‘) Ф.И.О 

иптоп 

$гис 
у Б1гЁпдау_1 [6 1962 ; год рождения 
тм угепаау 1 [#1 06 ; месяц рождения 
Ч Ыгейдау 1 [@1 9) 30 ; день рождения 
епа$ 

Уфгис 

9 Буг(пдау г 96 ? : день рождения 
м Б1гИбау2 06 ? ; месяц рождения 
у БЛгЕЛбау 2 0 ? : год рождения 
еп45 

епд$ :конец объединения 

паЕ1опа116у [в 9) 20 ; национальность 
еп0$ 

„ава 

$1 еетепё <> 

соде 


том. а1. $1.т Б1гЕАдау_1 
оу $1. Блгпдау 2. ОИ 
оу а1. $1.т_Б1гРаау_2 


Массивы структур — таблицы 


Обычной практикой является размещение одинаковых по содержанию экземпля- 
ров структур водном месте, последовательно — друг за другом. В результате обра- 
зуется логическая структура данных, называемая таблицей. Каждый экземпляр 
структуры, входящий в таблицу, называется элементом таблицы. 

Как физическая структура данных таблица представляет собой линейную по- 
следовательность ячеек памяти, число которых определяется количеством и раз- 
мером полей каждого элемента, а также числом элементов таблицы. 

Над таблицей можно определить следующие операции: 

включение нового элемента путем расширения таблицы или его вставки на сво- 

бодное место; 


» поиск элемента для последующей его обработки; 
® исключение элемента из таблицы. 


Скорость доступа к элементам таблицы при выполнении этих операций зави- 
сит от двух факторов — способа организации поиска нужного элемента и размера 
таблицы. 


Поиск в таблице 


Перечисленные выше операции с таблицей предполагают, что для однозначного 
доступа к ее элементам последние должны содержать один или более признаков, 
отличающих их от других элементов этой таблицы. С этой целью в логическую 


90 Глава 2. Сложные структуры данных 


структуру элемента включается по крайней мере одно поле — ключ, содержимое 
которого уникально для любого из элементов, входящих в таблицу. В общем слу- 
чае работа с таблицами сводится к методам решения задачи поиска нужного эле- 
мента таблицы по заданному значению ключа. Результат решения — получение 
адреса искомого элемента или заключение о его отсутствии. Для локализации 
элемента таблицы необходимо знать два адресных компонента — адрес табли- 
цы и смещение нужного элемента относительно ее начала. Адрес таблицы полу- 
чить несложно, так как он является адресом ее первого элемента. Что же касается 
определения второго компонента адреса, то для этого существует ряд методов, рас- 
смотрением которых мы сейчас и займемся. 

В ряде случаев наряду с ключевым полем определяют еще одно служебное 
поле — поле текущего состояния элемента, которое может принимать три зна- 
чения: 

элемент свободен — после инициализации таблицы элемент ни разу не исполь- 

зовался для хранения полезной информации; 


элемеит используется для хранения полезной информации; 


элемент удален — после инициализации таблицы элемент хотя бы один раз ис- 
пользовался для хранения полезной информации, после чего был освобожден. 


Целесообразность использования поля текущего состояния элемента будет вид- 
на из дальнейших рассуждений. 

С точки зрения организации поиска таблицы делятся на: 

неупорядоченные; 


древовидные; 
# упорядоченные; 
с вычисляемыми входами (хэш-таблицы). 


Неупорядоченные таблицы 


Это простейший вид организации таблиц. Элементы располагаются непосредствен- 
но друг за другом, без пропусков. Процесс поиска нужного элемента выполняется 
очень просто — последовательным перебором элементов таблицы начиная с пер- 
вого. При этом анализируется ключевое поле и в случае удовлетворения его усло- 
вию поиска нужный элемент считается обнаруженным. Такой способ поиска 
называется последовательным или линейным. Для добавления нового элемента не- 
обходимо найти первую свободную позицию, после чего выполнить операцию 
добавления. Процесс удаления можно реализовать следующим образом. После ло- 
кализации нужного элемента его поле текущего состояния нужно установить в со- 
стояние «элемент удален». Тогда процесс поиска места для добавления нового эле- 
мента будет заключаться в нахождении такого элемента, у которого поле текущего 
состояния элемента имеет значение «элемент удален» или «элемент свободен». 
Можно еще более оптимизировать работу с неупорядоченной таблицей путем до- 
бавления в начало таблицы (или перед ней) дескриптора, поля которого содержа- 
ли бы информацию о размере таблицы, положении первого свободного элемента 
ит. д. 
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Обычно неупорядоченные таблицы используют в качестве временных для хра- 
нения небольшого количества элементов (до 20). Для таблиц большего размера 
такая организация поиска неэффективна, поэтому для них следует применять дру- 
гие способы локализации нужного элемента. 

Приемы работы с неупорядоченной таблицей продемонстрируем на примере 
следующей задачи. Требуется прочитать содержимое файла таке. и обо всех 
десятичных и шестнадцатеричных числовых константах собрать следующую ин- 
формацию: значение константы и номер строки, в которой данная константа встре- 
тилась. После чего нужно вывести информацию о десятичных константах на экран. 
Для того чтобы избежать возни с несущественными деталями, введем следующие 
ограничения: 

* содержимое файла — идентификаторы и константы, разделенные не более чем 
одним пробелом; перед первым и последним идентификатором или констан- 
той в строке также следует по одному пробелу; 

®_ для удобства преобразования предполагаем, что длина и количество строк файла 
паКе!.4х находятся в диапазоне 0...99, а общая длина файла — не более 240 байтов. 


Поле текущего состояния представляет собой запись, битовые поля которой 
означают следующее: 
* биты би 1 — состояние элемента: 00 — свободен; 01 — используется; 10 — удален; 
" бит2 — тип константы: 0 — десятичная константа; 1 — шестнадцатеричная кон- 
станта; 
" бит3 — 0 — не последний элемент таблицы; 1 — последний элемент таблицы. 


и файл таКеф.Ехё с идентификаторами. среди которых присутствуют ] 
десятичные и шестнадцатеричные константы. | 


ть 5ёгис 

Та$_ ОЕ [6 0 ; адрес первого байта за концом таблицы 

е1ет_Ггее [6 0 : адрес первого свободного элемента 

: (ОРЕР — все занято) 

епд$ 

соп5фапе 5Егис 

Уае [*1 9) 0 : поле состояния элемента таблицы 
[@19) 0248 ; форматирование вывода на экран 

Кеу [@ 9) 10 р С° : ключ. он же значение константы 
[69 огав : форматирование вывода на экран 

11те [6 2 р (') ; строка файла. в которой 

: встретилась константа 

епа_11пе [6 041. бай. ‘$’ ; для удобства вывода на экран 

еп 

„Чата 

$ фаь Зфафе ФаБ <=> 

Саб соп$фапе 19 аир (<>) 
соп$фапе <В.> : последний элемент — бит 3-1 
епа ТаБ = $ - таб 

ЕПепате [е ‘пакеф. хе’. 0 

Пап] е Ч 0 : файловый манипулятор 

Я [в 240 бир (°') 


Ха таб ЧБ О4И бир (00). бав ; признак конца строки 
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сиг 11те 
. соде 


сус11: 


м1: 


[ео '0'-0ей дир (0) 

[6 ':'- '0' +1 @р С0'’) ; признак цифры 0...9 
[6] "Н- ":' @р (0), ** ; признак буквы "Н 
[ее ‘и’ - "Н’ дур (0), "П’ ; признак буквы ‘В’ 
6 ОТ - ‘и’ @р (00) 

{ее 0 


открываем файл 
оу ап. зап 


Теа 9х. Г/епате 
Тиё Ри 
Ко ех1ё : ошибка (с1=1) 
оу Нап{Те, ах 
читаем файл 
оу ап, ЗИ ; функция установки указателя 
ОУ Ьх. Папе 
МОУ сх. 240 ; читаем максимум 240 байтов 
Теа 9х. БиЁ 
те 21и 
$ ех{ 
ОУ сх. ах ; фактически считано байтов в сх 
инициализируем дескриптор таблицы $_баЬ 
Теа $1, ТаБ ; адрес таблицы в $1 
оу 5 ФфаБ.е1ет Ргее, $1 : первый элемент таблицы свободен 
ада $1, епа фаБ 
[ет $ баБ.Та5&_оЁР. $1 : адрес за концом таблицы 
Теа Ьх. х1аЕ баь 
Теа 91, БЕ 
сканируем до первого пробела 
риз$Н 95 
рор е5 
пу 91“ ^” 
герпе  °сазБ ; сканирование до первого пробела 
3сх2 915р1 ; таблица заполнена 
ризИ сх 


классифицируем символ после пробела (команда ХЬАТ) 
ое а1. [91] 


хТаь 

стр а1. '0' ; первый символ за пробелом - 0 
3е т 

стр а1. ой : первый символ за пробелом — О4И 
3е м2 

все остальное либо идентификаторы. либо неверно записанные числа 
рор сх 

Эр сус11 

первый символ после пробела - 0...9 

оу $1. 91 ; откуда пересылать 

оу асе 

ри$й 91 

герпе — зсазЬ : сканирование до первого пробела 
оу сх. 91 

дес сх 

5) сх. 51 ; сколько пересылать 

Теа 91. ФаБ 

стр $ фаБ.е?ет_Ргее. ОТРЕТН :есть свободные элементы? 
Зе 91$р1 ; свободных элементов нет 

Ще 91. $ ФфаБ.еТет_Ргее ;адрес первого свободного элемента 
ризИ 91 

Теа 91. [91].Кеу 

гер ПОУ$Ь : пересылаем в элемент таблицы 
дес 91 


Какого типа эта константа? 
стр уфе риг [913. *’ 


рор 91 
3е А 


п: 
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[941] .56ате. ОБИ ; десятичная константа 


$+5 
[91].5фаёе. 1006 ; шестнадцатеричная константа 
ат. сиг_11пе ; текущий номер строки в а1 
: преобразуем в символьное представление 
ай. 030и 
[91].11пе. ай 
ат. 0300 


[91+1].11пе. а1 : и в элемент таблицы 
[91].5{аёе, 16 ; помечаем элемент как используемый 


теперь нужно поместить в поле $ фаб.е]ет Ггее 
адрес нового свободного элемента 


стр 91. 5 ФаБ.Та$_оР 
да 91$р1 
ада 91. Суре соп5фапе ; к следующему элементу 
фе5е [91].$баёе. 16 
дп п5 : используется - к следующему элементу 
пу $ баБ.е1ет Ргее, 91 
рор [в] 
рор сх 
Зир сус11 
тис сиг 11пе : увеличить номер строки 
Эр Сус 
отображение на экране элементов таблицы 
Теа 91. баб 
тез [91].5$тафе. 1006 
дп? 7 
оу ан. 9 : функция вывода строки 
ОУ Чх, 91 
Чё РА 
а99 91. Туре сопзТапё 
стр 91. $ Са. 1а56_оРР 
тб 


В этой программе показаны основные приемы работы с неупорядоченной таб- 
лицей. Усложнить данный листинг можно, например, дополнив набор сведений 
о каждой константе информацией оеедлине. Далее можно попрактиковаться в этом 
вопросе, поставив себе задачу удалить из таблицы информацию о нулевых кон- 
стантах (обоих типов — О и 01) и вывести окончательное содержимое таблицы на 
экран. В качестве ключа для доступа к ячейке таблицы годится значение самой 
константы (размером 10 байтов). 

Обратите внимание на еще два момента, отраженные в этой программе. 


* Использование команды ХЁЕАТ для классификации символов в качестве цифр 
и остальных символов (букв). Среди других кодов в таблице перекодировки 
особо выделен байт со значением ОФВ, который является первым байтом в паре 
О40аН. Как вы помните, эта пара вставляется редакторами АЗСП-текстов для 
обозначения конца строки и перехода на другую строку. 

” Организация таблицы. Ей предшествует четырехбайтовый префикс, содержа- 
щий информацию о конце таблицы и первом свободном элементе таблицы. 
В целях оптимизации область памяти для буфера БиЁ и таблицы перекодиров- 
ки лучше выделять динамически и после анализа файла удалять. 


Древовидные таблицы 


Древовидные таблицы являются несколько улучшенным вариантом неупорядо- 
ченных таблиц. Новые записи в древовидную таблицу по-прежнему поступают 
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неупорядоченно. Но на сей раз место, занимаемое этими записями среди других 
записей в таблице, определяется значением ключевого поля. Принцип здесь такой 
же, как и при сортировке с помощью дерева (см. выше). 

В общем случае каждая запись в древовидной таблице сопровождается двумя 
указателями (рис. 2.7): один указатель хранит адрес записи с меньшим значением 
ключа (адрес узла-предка), второй — с большим (адрес узла-потомка) 


ссылка ссылка 
= Е 
Е авы“ 
17—> 


ры 





ЕЕ Я 
пЕСТВ 
а 
ВЕСИ 
РЕЯ 
БЕ 
[ВИ 
ВЕЕЕЯ 


Рис. 2.7. Древовидная организация таблицы 


Процесс добавления нового элемента в древовидную таблицу производится 
следующим образом. Значение ключа нового элемента сравнивается со значением 
ключа первого элемента дерева. По результатам сравнения ключей новый элемент 
«поступает» в левое или правое поддерево первого элемента дерева. Далее процесс 
сравнения и поступления в левое или правое поддерево очередного узла продол- 
жается аналогичным образом и до тех пор, пока не будет найден пустой элемент 
в нужном направлении просмотра. Новая запись помещается в данную пустую по- 
зицию, при этом настраивается указатель с адресом узла-предка. 

Преимущества древовидной организации таблицы проявляются на этапе поис- 
ка нужного элемента. Сам процесс подобен действиям на этапе вставки нового эле- 
мента в таблицу, являясь при этом в отличие от неупорядоченного поиска целе- 
направленным. Поиск прекращается либо при совпадении ключевого поля, либо 
при обнаружении пустого указателя, что означает отсутствие нужного элемента 
в таблице. 

Самое сложное в использовании древовидных таблиц — реализация процесса 
удаления элементов, так как при этом необходимо производить их переупорядо- 
чивание. 

Реализовать таблицу древовидной организации можно как с использованием 
полей указателей (см. выше), так и без них. Если отказаться от полей указателей, 
то таблица может представлять собой массив из и структур, которые пронумеро- 
ваны от 0 доп - 1. Тогда структура с ключом, соответствующим корню дерева, дол- 
жна находиться на месте структуры с номером #1 = (п — 1)/2 (целая часть от деле- 
ния). Соответственно, левое поддерево будет располагаться в левом подмассиве 
(элементы 0...т - 1), а правое — в правой части массива (элементы 1 + 1..и - 1). 
Корень левого поддерева — элемент т, = (т - 1)/2, корень правого поддерева — 
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элемент т," = т + 1+ (п- 1)/2 ит. д. Этот способ экономичнее с точки зрения рас- 
ходования памяти, но сложнее алгоритмически. Предполагается, что соответству- 
ющее таблице дерево сбалансировано и максимальное количество элементов в таб- 
лице известно. 

Наглядный пример организации древовидной таблицы — расстановка слов в ле- 
ксикографическом порядке. Эта операция выполняется с помощью лексикогра- 
фических деревьев, понятие о которых приведено ниже — в разделе, посвященном 
деревьям. Там же имеется соответствующий пример. 


Упорядоченные таблицы 


Работа с таблицей оказывается более эффективной, если элементы в ней некото- 
рым образом упорядочены. Наиболее часто таблица сортируется по значению клю- 
чевого поля. Но не исключено и использование другого принципа упорядочива- 
ния, к примеру по частоте обращения к элементам таблицы и т. п. Упорядочивание 
таблицы и последующий поиск в ней производится методами, рассмотренными 
выше. Порядок выполнения этих и других операций с отсортированной по значе- 
нию ключа таблицей рассмотрим на следующем примере. 

Пусть необходимо заполнить элементы таблицы информацией о 10 словах, вво- 
димых с клавиатуры. Длина слов — не более 20 символов. Структура элемента таб- 
лицы следующая: поле с количеством символов в слове; поле с самим словом. Пос- 
ле ввода информации о словах необходимо упорядочить элементы таблицы по 
признаку длины слов. Затем вывести на экран элемент таблицы, содержащий пер- 
вое из слов длиной 5 символов, удалить этот элемент из таблицы и вставить в нее 
новое слово, введенное с клавиатуры. 

При такой постановке задачи нам придется решить весь комплекс проблем, воз- 
никающих при работе с упорядоченными таблицами. 


Ви. вывод на экран элемента таблицы. содержащего первое из слов 
длиной 5 символов. удаление этого элемента из таблицы и вставка в нее 
нового слова. введенного с клавиатуры. 


еее ее еененнн---- + 

е1етепЕ ТаБ 5гис 

Теп [61° 0 ; длина слова 

$1тм_19 [ 20 дир (200) ; само слово 

еп 

Быг_Оай $гис 

еп БиР [6 24 ; длина БиР аб 

Теп_1п [61° 0 : действительная длина введенного слова 
; (без учета 091) 

тт [69] 21 дир (201) : буфер для ввода (с учетом 00) 

епд$ 

И еее нас + 


Макрокоманда: $ помзЬ. Пересылка строки. ] 
Вход: 1п_5Ёг — откуда. сиё_$г — куда. Теп_тоуз - сколько пересылать. | 


еее нннн----- + 
$ МОУ$Ь масго оуё ${г. 1т_$4г, еп пом$ 
ЧЯАИГТ <сх>. «Теп_тоу5> 

ризН сх 


еп 
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ТЕТЕ <51>, <1п_${г> 
рип 51 
епа1Е 
ТРОЕ <01>. <оиб_5г> 
рип 91 
епб1 Е 
УРАЛЕ <51>, <1п_$г> 
Теа $1. т 5 ; откуда пересылать 
еп? 
ТРАТЯТ <41>, <0иё_56г> 
Теа 91. сиё $г : куда пересылать 
епд1? 
ТРАТИТ <сх>. <Теп_пюу$> 
оу сх. Теп тоуз ; сколько пересылать 
еп? 
гер моу$Ь ; пересылаем строку 
ТЕАТР <01>, <оиф_5г> 
рор 091 
епо1Е 
ТРОТЕТ <$1>. <т_5Ег> 
рор $1 
епа1Р 
Т1А1Т <сх>. <Теп_поуз> 
рор сх 
еп? 
епат 
. дафа 
ФаБ еТетепи_ФаБ 10 дир (<>) 
Теп_баБ = $ - баб 
БТ Бит бай <> 
Кеу ЧБ 5 
ргеу е1етепё_{аЬ <> ; предыдущий элемент 
х е1етепё_фаБ <> ; временная переменная для сортировки 
.соде 
Теа 91. СаБ 
Теа $1. БиЁ.БиР 1т 
Ще сх. 10 
Теа 9х. ых 
поу ап. бан 
рибп 95 
рор е5 
;------ вводим слова с клавиатуры в буфер БиЁ 
т]: м ; сохраняем регистры 
176 2 
пу СТ. Би. 1еп_1т 
тоу [91].1еп.с1 : длина слова -> ФаБ. Тепдёй 
ада 91, $1 19 
гер моу$Ь : пересылка слова в элемент таблицы 
вн : восстанавливаем регистры 
ада 9%. Суре е1етепЕ_ФаБ 
Тоор т] 
------ упорядочиваем таблицу методом пузырьковой сортировки 
п = 10 
ОУ сх. п -1 
ОУ Ты 
у == внешний цикл — по 1 
@@сус11: ризй сх 
пу сх, п 
$иБ сх. $1 ; количество повторов внутреннего цикла 
рип 51 : временно сохраним 1 — теперь )-п 
ОУ $1, п-1 
------ цикл по ] с декрементом п-1 раз 
@@сус12: ри$И $1 


моу ах. фуре е1етеп аб 


бет: 


ЩИ 
оу 
оу 
54 
оу 
стр 
За 
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$1, ах 

91. ах 

41. Фуре еТетепте_фаБ ; в 41 адрес предыдущей записи 

а1. [91].1еп 

Е а! : сравниваем последующий с предыдущим 
т 


обмениваем ( после та$[.)]=х) 


$_ПЮУ$Ь 


х. [91]. <буре еТетей_фаБ> ; х=та$[)-1] 


$ моу$Ь [941]. [$1]. <Фуре е1етепё_ФаБ> ; па$[3-1]=та$[1] 

$ пюу$Ь [51]. х. <Ёуре еетепе фаБ> 

рор $1 

дес 51 

Тоор @@сус12 

рор 51 

ТИС $1 

рор сх 

аес сх 

му м2 

Эр @@сус11 

ищем элемент путем двоичного поиска 

оу 51, 0 : индексы первого и последнего элементов 

оу 97. п-1 : лоследней просматриваемой части 
; последовательности 

стр $1. 91 ; проверка на окончание (неуспешное): $1>01 

За ех1Е 

получим центральный индекс 

ОУ Ьх, $1 

а09 Ьх, 91 

5йг Ьх. 1 ; делим на 2 

ри$И Ых 

поу ах. буре е1етепё таб 

пи] Ьх 

оу Ьх, ах 

МОУ а1. Кеу : искомое значение в ах 

стр [Ьх].1еп, а] : сравниваем с искомым значением 

3е вета : искомое значение найдено 

да @@т3 ; [6х] .1епжк 

рор Ьх : здесь [Ьх].Теп<к 

ЮУ 51. 6х 

77с $1 

Эр сот _зеагсй 

рор Ьх 1 

Ще 91, Бх 

дес 91 

пр сопё_зеагсй 

ОУ ах. Туре е1етеп® таб 

ЩИ $1 

оу $1. ах ; конец поиска — в 51 адрес злемента таблицы 
: СО Словом длиной 5 байтов 

выводим его на экран 

оу а1. [$1].1еп 

хог сх. сх 

оу С]. а] : длина для пюу$Ь 

аат 

ог ах. 030301 ; в ах длина в символьном виде 

оу Бит. Теп_Би{. ап 

оу Бит. Теп_1п. а] 

ризИ 51 : Сохраним указатель на эту запись 

а0д $1. 51м_14 

Теа 91. БыГ.БиР 1п 

гер моу$Ь 

поу Буёе рёг [91].’$° :;конец строки для вывода 

1еа 9х, Биг 
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оу ап. 09 
тие 211 ; выводим 
ве удаляем запись 
рор 51 : восстановим указатель на запись 
поу 1. 51 


ада $1. Фуре еТетепЕ_ФаБ 
пу сх. Теп_ жаб 
5иЬ сх. $1 ; в сх сколько пересылать 
гер пМоУ$Ь 
1------ обнуляем последнюю запись 


хог а1. а1 
ОУ сх. Туре е1етепё_ваБ 
гер 51056 
1+е---- вводим слово с клавиатуры 
1ибег(: Теа 9х. БР 
ОУ ан. бай 
Ця 211 


------ С помощью линейного поиска ищем место вставки. 
: в котором выполняется условие БиР.Теп_1п=<[51].1еп 


Теа $1. ФаБ 
оу а1. БР. 1еп_1п 
@@т5: стр а1. [$1].1еп 
З5е @@тб 
ада $1, фуре еТетепё_фаБ 
Зпр @@т5 
@@тб: ризй $1 : запоминаем позицию вставки 


ев ЕЕ раздвигаем таблицу. последний элемент теряется 
а04 51. фуре е1летепё_баБ 


оу сх. 1еп_Фбаь 

5иБ сх. $1 : сколько пересылать 
50 

Теа $1, баб 

а99 $1, 1еп ФаБ 

ОУ 91, $1 


5иБ 51. фуре еТетепё_ФаБ 
гер моУ$Ь 


с16 
14----- формируем и вставляем новый элемент 
рор 91 ; восстанавливаем позицию вставки 
ризй 91 
хог а1. а1 
оу сх. фуре е]етелё таб 
гер 56056 ; обнуляем место вставки 
рор 01 
Теа $1. Биг. Бит Лт 
ЮУ СТ. БИГ. 1еп_1п 


[14 [91].1еп. сТ 
а6д 91. 5 14 
гер моу$6 ; вставляем 


Таблицы с вычисляемыми входами 


Ранее мы отмечали, что скорость доступа к элементам таблицы зависит от двух 
факторов — способа организации поиска нужного элемента и размера таблицы. 
Для маленьких таблиц любой метод доступа будет работать быстро. С ростом раз- 
мера таблицы способ организации доступа приходится выбирать прежде всего ис- 
ходя из критерия скорости локализации нужного элемента таблицы. Элементы 
таблицы отличаются друг от друга уникальным значением ключевого поля. При 
этом ключевыми могут являться не только одно, но и несколько полей элемента 
таблицы. Ключ, в том числе и символьный, в памяти представляется последова- 
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тельностью байтов. Исходя из того что ключ уникален, соответствующая двоич- 
ная последовательность также будет уникальной. А нельзя ли использовать это 
уникальное значение ключа для вычисления адреса местоположения элемента в та- 
блице? Оказывается, можно, а в ряде приложений это оказывается очень эффек- 
тивно, так как в идеальном случае доступ к нужному элементу таблицы осуществ- 
ляется всего за одно обращение к памяти. С другой стороны, на практике часто 
возникает необходимость размещения элементов таблицы с достаточно большим 
диапазоном возможных значений ключевого поля, в то время как программа ре- 
ально использует лишь небольшое подмножество значений этих ключей. Напри- 
мер, значение ключевого поля может быть в диапазоне 0...3999, но задача постоян- 
но востребует не более 50 значений. В этом случае крайне неэффективным было 
бы резервировать память для таблицы размером в 4000 элементов, а реально ис- 
пользовать чуть больше 1% отведенной для нее памяти. Гораздо лучше иметь воз- 
можность воспользоваться некоторой процедурой, отображающей задействованное 
пространство ключей на таблицу размером, близким к значению 50. Большинство 
подобных задач решается при помощи методики, называемой хэшированием. Ее 
основу составляют различные алгоритмы отображения значения ключа в значе- 
ние адреса размещения элемента в таблице. Непосредственное преобразование 
ключа в адрес производится с помощью функций расстановки (хэш-функций). Ад- 
реса, получаемые из ключевых слов с помощью лэш-функций, называются лэш-ад- 
ресами. Таблицы, для работы с которыми используются методы хэширования, на- 
зываются таблицами с вычисляемыми входами, хэш-таблицами или таблицами 
с прямым доступом. 

Основополагающую идею хэширования можно пояснить на следующем при- 
мере. Предположим, необходимо подсчитать, сколько раз в тексте встречаются 
слова, первый символ которых — одна из букв английского алфавита (или русско- 
го — это не имеет значения, можно в качестве объекта подсчета использовать лю- 
бой символ из кодовой таблицы). Для этого в памяти нужно организовать таблицу, 
количество элементов в которой будет соответствовать количеству букв в алфави- 
те. Далее следует составить программу, в которой текст будет анализироваться 
с помощью цепочечных команд. При этом нас интересуют разделяющие слова про- 
белы и первые буквы самих слов. Так как символы букв имеют определенное дво- 
ичное значение, то на его основе вычисляется адрес в таблице, по которому распо- 
лагается элемент, в минимальном варианте состоящий из одного поля. В этом поле 
ведется подсчет количества слов в тексте, начинающихся с данной буквы. В следу- 
ющей программе с клавиатуры вводится 20 слов (длиной не более 10 символов), 
производится подсчет английских слов, начинающихся с определенной строчной 
буквы, и результат подсчета выводится на экран. Хэш-функция (функция расста- 
новки) имеет вид: А = (С-97) - Г, где А — адрес в таблице, полученный на основе 
двоичного значения символа С; Г — длина элемента таблицы (для нашей задачи 
Г-= 1); 97 — десятичное смещение в кодовой таблице строчного символа «а» анг- 
лийского алфавита. 


Программа: рг902_07.азт. Подсчет количества слов. начинающихся ] 
с определенной строчной буквы | 





г Вход: ввод С клавиатуры 20 слов (длиной не более 10 символов). | 
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5гис 

4 И : длина Бит 1п 

[9 0 : действительная длина введенного слова 
; (без учета ап) 

[69 11 @р (201) ; буфер для ввода (с учетом бан) 


[419 26 аир (0) 
БЕ бай <=> 
9 ОЧ. бай. '$° :; для вывода функцией 09Н (1% 211) 


вводим слова с клавиатуры 


ОУ сх. 20 
Леа Чх, Би 
оу ай. бай 
1 2и 


анализируем первую букву введенного слова — 
вычисляем хзш-функцию: А=С*1-97 
оу Ы. БТ.БиР п 


5иБ Ы. 97 

ТИС [6х] 

100ор п 

выводим результат подсчета на экран 
рип 5 

рор е5 

хог а1. а1 

Теа 91. 

оу сх. Туре БиР_бай 

гер $6056 ; чистим буфер БиР 
МОУ сх. 26 

символ в БиЁ.БиР_1п 

Теа 9х. Бит 

МОУ Ы. 97 

рип Ьх 


ОУ БиР. Би 1п.Б1 
опять вычисляем хэш-функцию: А=С*1-97 и преобразуем 
“количество” в Символьный вид 


$иБЫ1. 97 

оу а1. [6х] 

аат 

ог ах. 03030И ; В ах длина в символьном виде 


поу  БиР.Леп_1т. а] 
му — БиР.Теп Бит, ай 
теперь выводим: 
оу ап. 09 


116 2 
рор Ьх 
тис Ы 


Тор м2 


Таким образом, относительно сложная с первого взгляда задача очень просто 
реализуется с помощью методов хэширования. При этом обеспечивается высокая 
скорость выполнения операций доступа к элементам таблицы. Это обусловлено 
тем, что адреса, по которым располагаются элементы таблицы, являются резуль- 
татами вычислений простых арифметических функций от содержимого соответ- 
ствующих ключевых слов. 

Перечислим области, где методы хэширования оказываются особенно эффек- 
ТИВНЫМИ. 
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* Разработка компиляторов, программ обработки текстов, пользовательских ин- 
терфейсов и т. п. В частности, компиляторы значительную часть времени об- 
работки исходного текста программы затрачивают на работу с различными таб- 
лицами — операций, идентификаторов, констант и т. д. Правильная организация 
работы компилятора с информацией в этих таблицах означает значительное 
увеличение скорости создания объектного модуля, может быть, даже не на один 
порядок выше. Кстати, другие системные программы — редакторы связей и за- 
грузчики — также активно работают со своими внутренними таблицами. 


Системы управления базами данных. Здесь особенный интерес представляют 
алгоритмы выполнения операций поиска по многим ключам, которые также 
основаны на методе хэширования. 


Разработка криптографических систем [30]. 


Поиск по соответствию. Методы хэширования можно применять в системах 
распознавания образов, когда идентификация элемента в таблице осуществля- 
ется на основе анализа ряда признаков, сопровождающих объект поиска, а не 
полного соответствия заданному ключу. Если рассматривать эту возможность 
в контексте задач системного программирования, то ее можно использовать для 
исправления ошибок операторов при вводе информации в виде ключевых слов. 
Подробная информация о поиске по соответствию приведена в литературе [32]. 


Но на практике не все так гладко и оптимистично. Для эффективной и безот- 
казной работы метода хэширования необходимо очень тщательно подходить как 
к изучению задачи на этапе ее постановки, так и к возможности использования 
конкретного алгоритма хэширования в контексте этой задачи. Так, на стадии изу- 
чения постановки задачи, в которой для доступа к табличным данным планирует- 
ся использовать хэширование, требуется проводить тщательные исследования по 
направлениям: диапазон допустимых ключей, максимальное количество элемен- 
тов в таблице, вероятность возникновения коллизий и т. д. При этом нужно знать 
как общие проблемы метода хэширования, так и нюансы конкретных алгоритмов 
хэширования. Одну из таких проблем рассмотрим на примере задачи. 

Пусть необходимо подсчитать количество двухсимвольных английских слов 
в некотором тексте. В качестве хэш-функции для вычисления адреса можно пред- 
ложить функцию подсчета суммы двух символов, умноженной на длину элемента 
таблицы: А = (С1+ С2) - Г - 971, где А — адрес в таблице, полученный на основе 
суммы двоичных значений символов С1 и С2; Г — длина элемента таблицы; 97 — 
десятичное смещение в кодовой таблице строчного символа «а» английского 
алфавита. Проведем простые расчеты. Сумма двоичных значений двух симво- 
лов «а» равна 97 + 97 = 194, сумма двоичных значений двух символов <7> рав- 
на 122 + 122 = 244. Если организовать хэш-таблицу, как в предыдущем случае, то 
получится, что в ней должно быть всего 50 элементов, чего явно недостаточно. Более 
того, для сочетаний типа «аб» и «Ба» хэш-сумма соответствует одному числовому 
значению. В случае когда функция хэширования вычисляет одинаковый адрес для 
двух и более различных объектов, говорят, что произошла коллизия, или столкно- 
вение. Исправить положение можно введением допущений и ограничений, вплоть 
до замены используемой хэш-функции. 
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Программист может либо применить один из известных алгоритмов хэширова- 
ния (что, по сути, означает использование определенной хэш-функции), либо изоб- 
рести свой алгоритм, наиболее точно отображающий специфику конкретной зада- 
чи. При этом необходимо понимать, что разработка хэш-функции происходит в два 
этапа. 


1. Выбор способа перевода ключевых слов в числовую форму. 
2. Выбор алгоритма преобразования числовых значений в набор хэш-адресов. 


Выбор способа перевода ключевых слов в числовую форму 


Вся информация, вводимая в компьютер, кодируется в соответствии с одной из 
систем кодирования (таблиц кодировки). В большинстве таких систем символы 
(цифры, буквы, служебные знаки) представляются однобайтовыми двоичными 
числами. В последних версиях У/Лт4о\з (МТ/2000/ХР) используется система ко- 
дировки Отисофе, в которой символы в частном и самом распространенном случае 
представляются в виде двухбайтовых величин. Как правило, ключевые поля эле- 
ментов таблиц — строки символов, которые могут состоять из букв, цифр и других 
символов, например пробела, знаков препинания и т. д. Совокупность этих симво- 
лов (в общем случае подмножества всех символов, описываемых таблицей коди- 
ровки) составляет алфавит. В этом алфавите каждому символу С поставлен в со- 
ответствие определенный номер М, = {0, 1, 2, 3..., п — 1}. Тогда строку 5 = 44, ,...а,4, 
образованную из символов этого алфавита, можно рассматривать как представле- 
ние некоторого целого числа в системе с основанием я. Значение этого числа мож- 
но вычислить по формуле: 


Например, рассмотрим алфавит, состоящий из первых пяти английских букв и 
пробела: (а, Ъ, с, 4, е, ' '}. Этим символам поставим в соответствие номера: а = 0, 
Ь = 1, с=2,а=3,е=4, ' ' = 5. Заметим, что основание этой системы п = 6. В таких 
условиях строке «сБа 4еа» по данной формуле соответствует ее числовое значе- 
ние: 

2.6 +1-6'+0.62+5.6%'+3.6'+4. 6+0. 68 = 36080. 

Таким способом, расширив предварительно алфавит, можно переводить в чис- 
ловую форму не только слова, но и целые словосочетания. 

Исходя изусловий задачи, можно выбрать иной способ перевода ключевых слов 
вчисловую форму. Главное здесь — постараться получить равномерное (или близ- 
кое к нему) распределение числовых величин. На втором этапе используется один 
из выработанных на первом этапе алгоритмов преобразования числовых значений 
в набор хэш-адресов. Качество получаемых результатов в основном определяется 
алгоритмом хэширования и соответствующей этому алгоритму хэш-функцией. 


Выбор алгоритма преобразования числовых 
значений в набор хэш-адресов 


Алгоритмы хэширования делятся на два типа: открытые и закрытые. Алгоритмы 
открытого хэширования предполагают, что объем памяти для структур хэширова- 
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ния не ограничен. Пример такого хэширования — метод цепочек — мы рассмот- 
рим ниже. Алгоритмы закрытого хэширования, наоборот, предполагают поиск ме- 
стоположения элемента в ограниченном пространстве, отведенном под хэш-таб- 
лицу. Перед обсуждением наиболее распространенных алгоритмов хэширования 
отметим их тесную связь с алгоритмами генерации псевдослучайных чисел. Это- 
муесть следующие причины. Во-первых, при заданном исходном значении после- 
довательность псевдослучайных чисел детерминирована (полностью предсказуе- 
ма), так как всегда производится по рекурсивной схеме. Согласно этой схеме 
результаты, полученные на предыдущих шагах, используются на последующих в 
качестве исходных параметров. По этой причине большинство алгоритмов полу- 
чения хэш-адресов, задействующих в качестве исходных параметров ключевые 
слова, в основе своей являются алгоритмами получения последовательностей псев- 
дослучайных чисел. Во-вторых, разрешение коллизий в ряде случаев также осу- 
ществляется с помощью алгоритмов генерации случайных чисел. 

Отличие алгоритмов хэширования от алгоритмов генерации псевдослучайных 
чисел состоит в снижении требований к степени корреляции (взаимозависимо- 
сти) соседних генерируемых псевдослучайных значений. Для алгоритмов хэши- 
рования качество псевдослучайных чисел особой роли не играет, оно влияет лишь 
на количество попыток размещения элемента в хэш-таблице и соответственно этим 
во многом определяет скорость работы конкретного алгоритма хэширования. 

Наиболее известные алгоритмы закрытого хэширования основаны на следую- 
щих методах [32]: 

» деления; 

* умножения; 

® извлечения битов; 

* середины квадрата; 

# сегментации; 

и перехода к новому основанию; 

алгебраического кодирования; 
® вычислении значения СВС (см. главу 9). 

Далее мы рассмотрим только первые четыре метода. Для остальных отметим 
лишь, что их используют либо в случае значительной длины ключевых слов, либо 
когда ключ состоит из нескольких слов. Информацию об этих методах можно по- 
черпнуть в литературе [32]. 

Рассмотрение методов хэширования будет произведено на примере одной за- 
дачи. Это позволит лучше понять их особенности, преимущества, недостатки и воз- 
можные ограничения. 

Необходимо разработать программу — фрагмент компилятора, которая соби- 
рает информацию об идентификаторах программы. Предположим, что в программе 
может встретиться не более М различных имен. Длину возможных имен ограни- 
чим восемью символами. В качестве ключа используются символы идентифика- 
тора, какие и сколько — будем уточнять для каждого из методов. Элемент таблицы 
состоит из 10 байтов: 1 байт для признаков, 1 байт для хранения длины идентифи- 
катора и 8 байтов для хранения символов самого идентификатора. 


104 — Гпава 2. Сложные структуры данных 


Метод деления 
Этот простой алгоритм закрытого хэширования основан на использовании остат- 
ка деления значения ключа К на число, равное числу элементов таблицы М или 
близкое к нему: 

А(К) = Кто М 


В результате деления образуется целый остаток А(К), который и принимается 
за индекс блока в таблице. Чтобы получить конечный адрес в памяти, нужно полу- 
ченный индекс умножить на размер элемента в таблице. Для уменьшения колли- 
зий необходимо соблюдать ряд условий: 


и Значение М выбирается равным простому числу. 


Значение М не должно являться степенью основания, по которому произво- 
дится перевод ключей в числовую форму. Так, для алфавита, состоящего из 
первых пяти английских букв и пробела {а, Ъ, с, Ч, е, ''} (см. пример выше), 
основание системы равно 6. Исходя из этого, число элементов таблицы М не 
должно быть степенью 6. 


Важно отметить случай, когда число элементов таблицы М является степенью 
основания машинной системы счисления (для процессора [пе] это 2). Тогда опе- 
рация деления (достаточно медленная) заменяется на несколько операций сдвига 
(очень быстрых). При этом не нужно забывать об обозначенном чуть выше усло- 
вии, когда значение М не должно являться степенью основания, по которому про- 
изводится перевод ключей в числовую форму. 

Уточним постановку обозначенной выше задачи для демонстрации данного 
метода. Положим: М = 64; в качестве ключа К будем использовать сумму кодов 
всех символов идентификатора. Идентификаторы вводим с клавиатуры, конец 
ввода — по нажатию клавиши пробела. Первый байт элемента таблицы — байт 
признаков, нулевой бит которого означает занятость элемента (единичное значе- 
ние). Коллизии пока разрешать не будем, сделаем это при рассмотрении соответ- 
ствующих методов повторного хэширования. При возникновении коллизий бу- 
дем обозначать их выводом на экран идентификаторов, послуживших причиной 
этого. 


: Программа: рг902_08.азт. Демонстрация метода деления на примере 
задачи сбора информации об идентификаторах программы. 


:| Вход: ввод с клавиатуры слов (длиной не более 10 символов). | 
В не еее + 


{| Выход: вывод слов. повлекших коллизии. на экран. | 
вы 


е1ет_ФаБ $ёгис 

Зфабе [69] 0 ; байт признаков 

Теп_14 [61°] 0 : длина идентификатора 

Биг 14 [6%] 8 бир (208) : буфер для хранения идентификатора 

еп 

Биг Оап $ёгис 

Теп Биг Ч 9 : длина Би 1й 

Теп_1п [6 0 : действительная длина введенного слова 
; (без учета бай) 

Биг п [6] 9 @р (20п) : буфер для ввода (с учетом бай) 

еп@$ 
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тар е]ет аб 64 дир (<>) 
1еп_фаБ [е1 9) 64 
1еп_е1ет 9м 10 
Биг Биг дай <=> 
0 бан. бан. *'$`° : для вывода функцией 09Н (1тё 211) 
сое 
------ вводим слова с клавиатуры 
т: Теа ах. Биг 
ЮУ ап. бай 
Ия 21и 
------ анализируем первую букву введенного слова 
. если пробел. то на выход 
стр Биг. Биг 1п. 208 
3е ех1ё 
----- ВЫДЕЛЕН ФРАГМЕНТ ВЫЧИСЛЕНИЯ ХЭШ-ФУНКЦИИ 
хог Ьх. Бх 
поу СТ. Биг. 1еп 1п 
хог $1. $1 
хог ах. ах 
2: ОУ Ы. Бт.БиР 11[$1] 
ада ах. Бх 
пс $1 
100р п? 
Уйг ах. 6 : делим на 64 
------ определяем адрес в таблице, по которому 
; будет размещен идентификатор 
И 1еп_еТет ; умножаем на 10 (длина элемента таблицы) 
Теа 91. таб 
ада 91. ах 
1------ анализируем занятость элемента 
переход на отображение идентификатора. если коллизия 
тез [91}.зфафе. 16 
м2 91$р1 
-----= формируем элемент таблицы 
ЕН установить бит 0 — занятость 
ог [91]. зфае, 1Ь 
+=--- пересылка идентификатора и его длины в элемент таблицы 
ри$И 9$ 
рор е5 
Теа $1. БФ. 1еп_1п 
хог сх. сх 
ОУ СТ. БИГ. 1еп_1п 
Тис сх  САЛину тоже нужно захватить 
ада 91. 1еп_14 
гер поу$Ь 
Эр т] 
------ выводим идентификатор. вызвавший коллизию. на экран 
91$р1: Теа ах, БР 
оу ап. о9н 
1 2 
Эр т] 
Метод умножения 


Для этого метода нет ограничений на длину таблицы, свойственных методу деле- 

ния. Вычисление хэш-адреса происходит в два этапа: 

1. Вычисление нормализованного хэш-адреса в интервале [0..1] поформуле: КК) = 
= (С.К) тоа 1, где С — некоторая константа из интервала [0..1], К — результат 
преобразования ключа в его числовое представление, то4 1 означает, что КК) 
является дробной частью произведения С. К. 
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2. Конечный хэш-адрес А(К) вычисляется по формуле А(К) = М. КК)], где М — 
размер хэш-таблицы, а скобки [] означают целую часть результата умножения. 


Удобно рассматривать эти две формулы вместе: 
А(К)=М- (С.К) тоа 1. 

Кнут в качестве значения С рекомендует «золотое сечение» — величину, рав- 
ную ((\%5) - 1)/2 = 0,6180339887. Значение КК) можно формировать с помощью 
как команд сопроцессора, так и целочисленных команд. Команды сопроцессора 
вам хорошо известны и трудностей с реализацией последней формулы не возни- 
кает. Интерес представляет реализация вычисления А(К) с помощью целочислен- 
ных команд. Правда, в отличие от реализации сопроцессором здесь все же удобнее 
ограничиться условием, когда М является степенью 2. Тогда процесс вычисления 
с использованием целочисленных команд выглядит так: 

1. Выполняем произведение С. К. Для этого величину «золотого сечения» 
С = 0,6180339887 нужно интерпретировать как целочисленное значение, соот- 
ветствующее длине используемого машинного слова 6 в битах. Если В = 8, то 
соответственно С = 62, для В = 16 — С= 61 803, ит. д. В качестве результата это- 
го шага берутся старшие 6 битов произведения, причем считается, что десятич- 
ная точка стоит слева от этих битов. 


2. При размере таблицы, равном степени 2 (М = 2»), в качестве конечного хэш- 
адреса берутся первые р из 6 цифр, получившихся на шаге |. 


За исключением фрагмента вычисления хэш-функции, сама программа такая же, 
как и в методе деления. Поэтому вставьте фрагмент, приведенный ниже, на место 
в программе, соответствующее вычислению хэш-функции (отчеркнуто линиями). 

феестяя ВЫДЕЛЕН ФРАГМЕНТ ВЫЧИСЛЕНИЯ ХЭШ-ФУНКЦИИ 


хог Ьх. Бх 
пу с1. Биг. 1еп_1п 
хог $1. $1 
хог ах. ах 
т2: ОУ Ы. БЕ.БиР 11[$1] 
ада ах, 6х 
ТИС $1 
Тоор 2 : получили К 
ОУ Ьх. 61803 
пи] Ьх 


1------ для М=64 р=б: получаем произведение в ейх из @х:ах 
ОУ сх. 16 


из: Сс 
гс] ах. 1 
гс] еах. 1 
Тор  п3 
Б5г есх. едх : в есх номер первой единичной позиции 
: в е@х (относительно нулевой) 
тис с] 
гог еах. с] : значение у левого края е@х 
ЮУ сх. 6 ; вдвигаем в ах слева р=б бит 
пм: С1с 
гс] едх. 1 
гс] ах. 1 
Тоор 4 
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Из результатов тестирования видно, что этот метод лучше задействует табли- 
цу, более равномерно размещая в ней элементы. 

Следующие два метода будут рассмотрены только концептуально, так как слож- 
ностей с их реализацией нет, кроме сильной зависимости от ключей, используе- 
мых в конкретной задаче. 


Метод извлечения битов 


Данный метод считается самым старым. Он рассматривает ключевое слово как 
строку битов. Двоичное значение хэш-адреса образуется сцеплением такого коли- 
чества битов, которое необходимо для адресации всех элементов хэш-таблицы. 
Позиции, из которых извлекаются биты, определяются на основе статистического 
анализа возможных ключевых слов, то есть из условий конкретной задачи. Необ- 
ходимо стремиться к тому, чтобы появление 0 и 1 в выделяемых позициях было 
как можно более равновероятным. Здесь трудно дать рекомендации, просто нуж- 
но провести анализ как можно большего количества возможных ключей, разделив 
составляющие их байты на тетрады. Для формирования хэш-адреса нужно будет 
взять биты из тех тетрад (или целиком тетрады), значения в которых изменялись 
равномерно. 


Метод середины квадрата 


В литературе часто упоминается метод середины квадрата как один из первых 
методов генерации последовательностей псевдослучайных чисел. При этом он не- 
пременно подвергается критике за плохое качество генерируемых последователь- 
ностей. Но, как упомянуто выше, для процесса хэширования это не является недо- 
статком. Более того, в ряде случаев это наиболее предпочтительный алгоритм 
вычисления значения хэш-функции. Суть метода проста: значение ключа возво- 
дится в квадрат, после чего берется необходимое количество средних битов резуль- 
тата. Возможны варианты — при различной длине ключа биты берутся с разных 
позиций. Для принятия решения об использовании метода середины квадрата для 
вычисления хэш-фувкции необходимо провести статистический анализ возмож- 
ных значений ключей. Если они часто содержат большое количество нулевых би- 
тов, то это означает, что распределение значений битов в средней части квадрата 
ключа недостаточно равномерно. В этом случае использование метода квадрата 
неэффективно. 

На этом мы закончим знакомство с методами хэширования, так как полное об- 
суждение этого вопроса не является предметом книги. Информацию об остальных 
методах (сегментации, перехода к новому основанию, алгебраического кодирова- 
ния) можно получить из различных источников, среди которых следует выделить 
[32] и [27]. 

В ходе реализации хэширования с помощью методов деления и умножения воз- 
можные коллизии мы лишь обозначали без их обработки. Настало время разоб- 
раться с этим вопросом. 


Обработка коллизий 
Для обработки коллизий применяются две группы методов: 
® закрытые — в качестве резервных используются ячейки самой хэш-таблицы; 
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” открытые — для хранения элементов с одинаковыми хэш-адресами выделяется 
отдельная область памяти. 


Видно, что эти группы методов разрешения коллизий соответствуют класси- 
фикации алгоритмов хэширования — они тоже делятся на открытые и закрытые. 
Яркий пример открытых методов — метод цепочек, который сам по себе является 
самостоятельным методом хэширования. Он несложен, и мы рассмотрим его не- 
сколько позже. 

Закрытые методы разрешения коллизий более сложные. Их основная идея — 
при возникновении коллизии попытаться отыскать в хэш-таблице свободную ячей- 
ку. Процедуру поиска свободной ячейки называют опробыванием, или повторным 
хэшированием (вторичным хэшированием). При возникновении столкновения к 
первоначальному хэш-адресу А(К) добавляется некоторое значение р, и вычисля- 
ется выражение: 

А(К) = (А(К) + р,) то4 М, 
где? = 0...М. 

Если новый хэш-адрес А(К) опять вызывает коллизию, то выражение вычис- 
ляется прир,, ит. д. 

Здесьр,=р‚„Р.„,Р...; М — размер таблицы; А(К) — значения хэш-адреса (началь- 
ное и очередное), вычисленные при определенном р, 

Перечисленные ниже методы отличаются способом вычисления значений р; 


и линейное повторное хэширование; 
* квадратичное повторное хэширование; 

" случайное повторное хэширование; 

* вторичное хэширование сложением. 

Использование любого метода повторного хэширования предполагает, что до- 
ступ к определенной ячейке абсолютно предсказуем с данным значением хэш-ад- 
реса, так как для записи в хэш-таблицу и поиска в ней используются одни и те же 
процедуры. 


Линейное повторное хэширование 


Линейное повторное хэширование предполагает, что к начальному хэш-адресу 
прибавляется по единице до тех пор, пока не будет обнаружена незанятая ячейка 
(в данном разделе под «единицей» понимается не число 1, а размер элемента таб- 
лицы). 

Первоначально значение р, полагается равным 0. Тогда формула А(К) = 
= (А(К) + р,) тод М соответствует методу деления, который по значению ключа К 
вычисляет значение хэш-функции А(К), то есть адрес размещения элемента таб- 
лицы, к которому осуществляется доступ для записи или чтения. Если элемент 
таблицы свободен (или при поиске значение ключа элемента совпадает с К), то 
в него осуществляется запись. В случае занятости элемента (или если при поиске 
значение ключа элемента не совпадает с К) значение функции А(К) вычисляется 
при значении р, = 1. В случае неудачи значение функции А(К) рассчитывается при 
значении р, = 2, ит. д. Таким образом доступ осуществляется к следующим под- 
ряд элементам таблицы, начиная с некоторого начального, вычисленного по фор- 
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муле А(К) = К шо4 М (см. метод деления). Этот метод повторного хэширования 
неэффективен, так как часто приводит к образованию длинных цепочек элемен- 
тов, имеющих одинаковое значение хэш-функции. Для примера доработаем про- 
грамму, использующую для работы с хэш-таблицей метод умножения. В результа- 
те получится программа ргд02_09.ат, полный текст которой имеется среди файлов, 
прилагаемых к книге. 


: Программа: рг902_09.азт. Демонстрация линейного повторного хэширования | 
:| на примере задачи сбора информации об идентификаторах программы. 


1------ определяем адрес в таблице. по которому 
Н будет размещен идентификатор 


ЮУ Ьх. ах : сохраним его на случай коллизии 

м5: пи] Теп_е1ет : умножаем на 10 (длина элемента таблицы) 
Теа 41. ТаБ 
ада 41, ах 


а анализируем занятость элемента. 
: переход на отображение идентификатора. если коллизия 
тез [91].3фафе. 16 
Эп2 91$р1 
------ формируем элемент таблицы 
НЕЕ установить бит 0 - бит занятости 
ог [91].5фаёе. 16 
у------ пересылка идентификатора и его длины в элемент таблицы 


ризй 95 

рор е5 

Леа $1. БЕ. 1еп 1п 

хог сх, сх 

[о с1. БиЕ.1еп_1п 

Чис сх ; ДЛИНУ тоже нужно захватить 


ада 41. Теп_14 
гер поу$Ь 
тр т] 
1------ выводим идентификатор, вызвавший коллизию, на экран 


------ повторное хэширование. 
ищем место в таблице для идентификатора. вызвавшего коллизию. 
путем линейного повторного хэширования 


Тис Вх 
ЮУ ах. Бх 


Зтр м5 


Квадратичное повторное хэширование 


Процедура квадратичного повторного хэширования предполагает, что процесс 
поиска резервных ячеек производится с привлечением некоторой квадратичной 
функции, например такой: 

р‚.=а2+Ь,+с. 

Хотя значения а, 6, с можно задавать любыми, велика вероятность быстрого 
зацикливания значений р.. Поэтому в качестве рекомендации опишем один из вари- 
антов реализации процедуры квадратичного повторного хэширования, позволяю- 
щий осуществить перебор всех элементов хэш-таблицы [32]. Для этого значения 
в формуле р, = а? + 6, + с положим: а = 1,6 =с= 0. Размер таблицы желательно за- 
давать равным простому числу, которое определяется формулой М = 4 .п + 3, где 
п — целое число. Для вычисления значений р, используют одно из соотношений: 
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р, = (К+Р) то4 М; 
р, = (М+2.К-(К+2Р) тоаМ) то4 М, 


где! = 1,2,..., (М - 1)/2; К — первоначально вычисленный хэш-адрес. Адреса, фор- 
мируемые на основе первого соотношения, покрывают половину хэш-таблицы, а ад- 
реса, формируемые при помощи второй формулы, — другую половину. Практи- 
чески реализовать данный метод можно следующей процедурой: 


1. 
2. 
3. 


4. 
5. 


Задание : = —М. 
Вычисление хэш-адреса К одним из методов хэширования. 


Если ячейка свободна или ключ элемента в ней совпадает с искомым ключом, 
то завершение процесса поиска. Иначе? = 1+ 1. 


Вычисление й = (# +) под М. 
Если { < М, то переход к шагу 3. Иначе (:> М) таблица полностью заполнена. 
Программа та же, что приведена в методе линейного повторного хэширования, 


за исключением добавления одной команды для инициализации процесса повтор- 
ного хэширования, самого фрагмента повторного хэширования и небольших из- 
менений сегмента данных: 


= 21 
„Саба 
М [6 4 *п+3 ; размер таблицы 
ТаБ е1ет ФаБ 4%*п+3 дир (<>) 
Теп_ФаБ [6 4*п+3 
]еп_ е1ет [6 10 
1 Чи 0 
БТ Биг бай <> 
[69 Ч. бай. '$' ; для вывода функцией 098 (1пе 21п) 
.соде 
1-*---- вводим слова с клавиатуры 
т: ОУ 1, -(4 *п+ 3) ; начальное значение 
;------ повторное хэширование. 
ы ищем место в таблице для идентификатора. вызвавшего коллизию. 
путем квадратичного повторного хзширования (его индекс в Бх) 
тис 1 
у-----= определяем модуль 1 
о ах, 1 
ы ах. 15 : операнд отринателен 
пс тб : неотрицателен 
пед ах : вычисляем модуль 
1------ сравниваем 1<М. Если [>-М. то на выход 
тб: стр а1. М 
Зае ех1ё 
------ зычислем П:=(1+|1|) под М 
ада ах. 6х 
1 М 
Зиг ах. 8 ; в ах новое значение хэш-адреса 
: (индекса в таблице) 
З7р м5 


Случайное повторное хэширование 


Для метода случайного повторного хэширования размерность таблицы М должна 
быть степенью двойки М = 2*. Значения р, вычисляются по следующему алгоритму: 


1. 


Первоначально р, = 1. 
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2. Каждое последующее р, рассчитывается так: получить р, = 5 р, - 1, выделить 
младшие # + 2 разрядов р, результат поместить обратно в р, затем эту величи- 
ну сдвинуть вправо на 2 разряда (разделить на 4). Результат будет являться 
очередным значением р, 

Преимущество этого метода в том, что получаемые числа различны. Основа 
программы та же, что и для метода линейного повторного хэширования, поэтому 
ниже приведены лишь измененные фрагменты. 


„дата 
М [619 64 
р! [6 ? 
Нуе [61°] 5 
.с0де 
1-----+ начальное значение для процесса повторного хэширования, 
если он будет 
ОУ рт. 1 
1------ вводим слова с клавиатуры 


м1: }еа 9х. БИТ 


-те-- повторное хэширование. 
ищем место в таблице для идентификатора. вызвавшего коллизию. 
с помощью случайного повторного хэширования (К=б => К+2=8) 


оу ах. р1 

ада ах. Бх 

1 М 

$йг ах, В ; в ах новое значение хзш-адреса 


: (индекса в таблице) 
------ готовим рт для второго и последующего шагов 
повторного хэширования 


ризН ах 
МОУ ах. р1 
пи Луе 


у----- так как К+2=8. то это байт. и выделять ничего не нужно. 
при необходимости применяйте команду АК с соответствующей 
маской. обозначим ее 


апа ах. ОРТ : выделить младшие К+2 разряда рт 
Зиг ах. 2 ; разделить на 4 

оу рт. ах 

рор ах 


Эпр м5 


Повторное хэширование сложением 

Этот метод предполагает другой способ вычисления очередного значения р; р, = = 
(1. й) тоа М, где; = 1,2, 3, 4, ...М — размер таблицы (должен быть простым числом); 
р — исходное значение хэш-функции в диапазоне 1...М№ — 1. Соответствующую про- 
грамму для этого реализуйте самостоятельно. 


Формат таблицы хэширования и ее элементов 


Хоропшю продуманные формат хэш-таблицы и структура ее элементов являются 
мощным резервом увеличения производительности метода хэширования. Приве- 
дем несколько общих рекомендаций, которые во многих случаях могут оказаться 
полезными. 

Элемент любой хэш-таблицы логически можно считать состоящим из двух ча- 
стей: ключевой и информационной. Для совместного хранения этих двух частей 
требуется большой объем памяти, так как закрытое хэширование предполагает, 
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что под таблицу отводится максимально потребный объем памяти, даже если ре- 
ально используется небольшое количество элементов. В результате возрастает ве- 
роятность непроизводительного расходования памяти. Этот недостаток можно 
исправить, если хэш-таблицу физически разделить на две части: ключевую и ин- 
формационную. Под ключевую часть по-прежнему отводится столько памяти, 
сколько необходимо для хранения максимального количества элементов хэш-таб- 
лицы. Элемент хэш-таблицы в ключевой части хранит сами ключи (или их внут- 
реннее представление), поле признаков (см. ниже) и указатель на информационную 
часть данного элемента таблицы. Информационные части хранятся в отдельной 
области памяти, при этом в отличие от ключевой части таблицы нет необходимо- 
сти хранить информационные части для неиспользуемых элементов. По мере за- 
полнения таблицы память для хранения информационных частей элементов мож- 
но выделять динамически. Такая схема поддержания хэш-таблицы называется 
индексной. 

Другой вариант формата хэш-таблицы может задействовать свойства странич- 
ной адресации. Это можно осуществить для линейного повторного хэширования, 
для которого характерно попадание резервных элементов поблизости от значения 
вычисленного хэш-адреса. Вероятность попадания можно еще увеличить, если 
в процедуре повторного хэширования адресные смещения вычислять циклически, 
по модулю, равному размеру таблицы. 

И последний вариант построения хэш-таблиц — клеточная организация. Ее так- 
же применяют при линейном повторном хэшировании. Суть этого варианта в том, 
что группа элементов таблицы объединяется в образование, называемое клеткой 
(рис. 2.8). До тех пор пока в клетке есть свободные ячейки, в них производится 
размещение новых элементов, соответствующих одному хэш-адресу. 


Две клетки по 4 позиции (есть свободные) 






[12] Данные |] свободно |] Свободно || Свободно || Конец | 


Рис. 2.8. Клеточная организация хэш-таблицы 


Особенности формата таблицы нужно как-то описывать. Для этого в элемент 
таблицы, помимо ключевой и информационной частей, вводят поле признаков. 
В начале обсуждения поиска по таблице упоминалось назначение поля текущего 
состояния элемента таблицы. Поле признаков выполняет аналогичную функцию, 
но с учетом особенностей метода хэширования. Состав, структура и форма реали- 
зации этого поля определяются особенностями конкретной задачи. В большин- 
стве случаев его удобно исполнять в виде битового поля и для обработки привле- 
кать соответствующие средства ассемблера. Перечислим назначение некоторых 
битов, из которых может состоять поле признаков: 


” занятости — может быть использован в процессе размещения нового объекта 
для быстрого определения занятости элемента таблицы; 


® удаления (см. ниже раздел «Удаление — решение проблемы»); 


Структуры 113 


” конца цепочки повторного хэширования, или коллизии, — предназначен для 
определения конца цепочки резервных ячеек, соответствующих определенно- 


му хэш-адресу; 
* конца таблицы; 


" связи — подходит для определения того, что содержит информационное поле: 
собственно информационную часть данного элемента таблицы или указатель 
на другую область памяти, где она размещена. 


Некоторые из возможных структур элементов таблицы хэширования показа- 
ны на рис. 2.9. 
На рисунке использованы следующие обозначения: 


" Ш -— идентификатор ключевого слова; 

# Р, — указатель области данных (индекс); 

® Р, — указатель области переполнения (или следующей записи в цепочке); 
* Т— терминальный символ; 

и У — флаг занятости; 

#® О— флаг вычеркивания; 

* С— флаг коллизии; 

Ш | — флаг связи. 


[о | енные 


Го ЕБЕ рые неаные | 


Рис. 2.9. Возможные структуры элементов таблицы хэширования 


Удаление — решение проблемы 


Выше мы разобрались с порядком выполнения двух основных операций с хэш- 
таблицей. Третья операция — удаление — не так проста в реализации. При удале- 
нии элемента внутри некоторой цепочки повторного хэширования его нельзя 
пометить как свободный, так как потеряются остальные элементы с таким же зна- 
чением хэш-адреса. Сдвиг всех элементов цепочки к ее началу — процесс громозд- 
кий и неэффективный. Гораздо производительнее использовать биты в поле при- 
знаков. Например, для линейного повторного хэширования проблема решается 
просто — удаляемый элемент помечается как «удаленный» и впоследствии может 
рассматриваться как свободный для размещения новых элементов с тем же зна- 
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чением хэш-адреса. Для того чтобы удаленный элемент сделать свободным, необ- 
ходимо проверить следующий возможный элемент в цепочке. Если он пуст, то и 
удаляемую ячейку можно пометить как свободную. Для случайного повторно- 
го хэширования можно использовать подобные методы, но при этом необходимо 
помнить, что для него в отличие от линейного метода процесс прохождения по 
цепочке повторного хэширования необратим. 


Метод цепочек 


«На закуску» рассмотрим суть еще одной схемы хэширования, которая одновре- 
менно может выступать в качестве метода повторного хэширования. Метод цепо- 
чек является методом открытого хэширования и свободен от многих недостатков 
и проблем моделей закрытого хэнгирования. 

В основе метода цепочек лежат три объекта: хэш-таблица, указатель ближай- 
шей свободной ячейки и область памяти для размещения информационных частей 
элементов хэш-таблицы. Модель метода цепочек показана на рис. 2.10. Хэш-таб- 
лица здесь является таблицей указателей на начало цепочек элементов с опре- 
деленным значением хэш-адреса. После вычисления хэш-адреса посредством со- 
ответствующего ему элемента хэш-таблицы программа получает доступ к началу 
цепочки элементов с данным значением хэш!-адреса. Если цепочка пуста, то из ука- 
зателя ближайшей свободной ячейки извлекается адрес, который заносится в эле- 
мент хэш-таблицы. В указатель ближайшей свободной ячейки заносится другой 
адрес, который будет впоследствии использоваться для размещения очередного 
нового элемента. Если цепочка не пуста, то при поиске программа просто идет по 
цепочке указателей и проверяет значение ключей до тех пор, пока не будет найден 
нужный элемент или не встретится элемент, отмеченный последним в цепочке. 
При добавлении элемента в цепочку с определенным значением хэш-адреса в со- 
ответствующий элемент хэш-таблицы заносится адрес из указателя ближайшей 
свободной ячейки. В поле связи нового элемента помещается указатель из элемен- 
та хэш-таблицы для данного хэш-адреса. Таким образом, добавление новых эле- 
ментов производится в начало цепочек, что оправданно, так как статистически об- 
ращение к новым элементам происходит чаще. 


Новый элемент : в памяти ^^^-. 


} 
Старый / 


указатель ое оееененененн--нт 7 


Ближайшая Новый 
указатель 





Рис. 2.10. Модель метода цепочек 
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Следует отметить, что метод цепочек значительно проще реализует проблему 
удаления элементов путем манипуляции битами в поле признаков и указателями. 

Пример для демонстрации метода цепочек мы приводить не будем, так как для 
этого необходимы знания по работе со списками, которые являются предметом 
изучения следующего раздела. Метод цепочек потребуется нам при изучении воп- 
росов компиляции, к тому времени мы уже будем обладать необходимыми знани- 
ями и сможем безболезненно написать соответствующий программный код. 

Перечисленные выше методы хэширования не являются догмой, так как, под- 
черкнем еще раз эту мысль, выбор алгоритма хэширования определяется прежде 
всего постановкой задачи. Поэтому программист вполне может изобрести новый 
метод хэширования (по сути, разработать свою хэш-функцию), наиболее точно 
отображающий специфику конкретной задачи. Но хэширование не панацея, и есть 
ряд областей, где его использование затруднено, недопустимо или просто невоз- 
можно. Прежде всего это касается временного фактора. Для метода хэширования 
на разных наборах исходных данных время доступа к элементам таблицы будет 
различным и зачастую трудно предсказуемым. Поэтому альтернативой для задач, 
для которых должно быть известно максимальное время доступа к данным, могут 
являться методы, основанные на деревьях поиска, и т. п. Наибольший эффект от 
хэширования — при поиске по заданным идентификаторам или дескрипторам, что 
характерно для задач баз данных, обработки документов и т. д. Для задач, в кото- 
рых поиск ведется сравнением или вычислением сложных логических функций, 
лучше использовать традиционные методы сортировки и поиска. 

Для того чтобы совершить плавный переход к рассмотрению следующей струк- 
туры данных — списков, вернемся еще раз к одной проблеме, связанной с массивами. 
Среди массивов можно выделить массивы специального вида, которые называют 
разреженными. В этих массивах большинство элементов равны нулю. Отводить 
место для хранения всех элементов расточительно. Естественно, возникает жела- 
ние сэкономить. Что для этого можно предпринять? 

Техника обработки массивов предполагает, что все элементы расположены в со- 
седних ячейках памяти. Для ряда приложений это недопустимое ограничение. 

Обобщенно можно сказать, что все перечисленные выше структуры имеют об- 
щие свойства: 

постоянство структуры данных на всем протяжении ее существования; 

п память для хранения отводится сразу всем элементам структуры и все элемен- 
ты находятся в смежных ячейках памяти; 

* отношения между элементами просты настолько, что можно исключить потреб- 
ность в средствах хранения информации об их отношениях в какой бы то ни 
было форме. 

Исходя из этих свойств, означенные структуры данных и называют статиче- 


СКИМи. 
Снять подобные ограничения можно, используя другой тип данных — списки. 
Для них подобных ограничений не существует. 
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Список 


Если у веревки есть один конец, значит, 
у нее должен быть и другой. 


Закон Микша (Прикладная Мерфология) 


В общем случае под списком понимается линейно упорядоченная последователь- 
ность элементов данных, каждый из которых представляет собой совокупность 
одних и тех же полей. Упорядоченность элементов данных может быть двоякой: 


элементы списка располагаются последовательно как в структуре представле- 
ния, так и в структуре хранения — список такого типа называется последова- 


тельным; 


порядок следования элементов задается с помощью специальных указателей, 
которые расположены в самих элементах и определяют их соседей справа и/ ИЛИ 
слева — подобные списки называются связными. 


Последовательные списки 


Если количество элементов в списке постоянно, то в зависимости от их типа спи- 
сок вырождается в вектор, массив, структуру или таблицу. Отличие списка от этих 
структур данных — в длине. Для списков она является переменной. Поэтому про- 
граммист, разбираясь с самими списками, должен уделить внимание тому, каким 
образом ему следует выделять память для хранения списка. Обычно языки высо- 
кого уровня имеют соответствующие средства, в отличие от языка ассемблера. При 
написании программы на ассемблере программист должен уметь напрямую обрла- 
титься к операционной системе для решения проблемы динамического управле- 
ния памятью. В примерах мы будем использовать соответствующие функции АР! 
У п32 как более современные, хотя для общего случая это не принципиально. В М$ 
00$ имеются аналогичные функции (с точки зрения цели использования) — это 
функции 488, 49Н, 4аН прерывания 21Н. Вопрос динамического управления памя- 
тью в силу своей важности в контексте настоящего рассмотрения требует особого 
внимания. 

Отличие последовательных списков от связных состоит в том, что добавление 
и удаление элементов возможно только по концам структуры. В зависимости от 
алгоритма изменения различают такие виды последовательных списков, как сте- 
ки, очереди и деки. Эти виды списков обычно дополняются служебным дескрип- 
тором, который может содержать указатели на начало и конец области памяти, 
выделенной для списка, указатель на текущий элемент. 

Зачем нужен, к примеру, стек? Необходимость использования своего стека 
в программе вполне вероятна, хотя бы исходя из того, что элементы, для хранения 
которых он создается, могут иметь размер, отличный от 2/4 байта. 

Важно понимать, что внутренняя структура элемента практически не зависит 
от типа последовательного списка. Списки отличает набор операций, которые про- 
изводятся над ними. Поэтому рассмотрим их отдельно для каждого типа последо- 
вательного списка. 
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Стек 

Стек — последовательный список, в котором все включения и исключения эле- 
ментов производятся на одном его конце — по принципу ЛЕО (Таз т Ей $ Оцё — 
последним пришел, первым ушел). 

Для стека определены следующие операции: 

* создание стека; 

включение элемента в стек; 

исключение элемента из стека; 

очистка стека; 

проверка объема стека (числа элементов в стеке); 

” удаление стека. 

Создание стека должно сопровождаться инициализацией специального де- 
скриптора стека, который может содержать следующие поля: имя стека, адреса ниж- 
ней и верхней его границ, указатель на вершину стека. 

Иллюстрацию организации и работы стека произведем на примере задачи, ана- 
лизирующей правильность согласования скобок в некотором тексте. Причем ус- 
ловимся, что скобки могут быть нескольких видов: (), {}, [], <>. Программа реали- 
зована в виде приложения \/1т32 с использованием функций АРУ \/1т32 для работы 


с кучей (из нее выделяется память для стека). 


еее е-ае- + 
Программа: рг912_51.азт. Проверка правильности расстановки скобок 
в тексте — иллюстрируется работа со стеком. 








еее + 
| Вход: строка символов. | 
пенсне + 
:| Выход: сообщение на экран о том. согласованы скобки или нет. | 
ен + 


Имя стека — имя экземпляра структуры. Перед обращением к макрокомандам 
работы со стеком необходимо инициализировать поля 512е_$1К и $12е_Зтет. 








еее +++- = + 
Че5с_$1К 5гис : дескриптор стека 
р_$Таг да 0 : адрес блока (начала области памяти 
; для стека) из общей кучи процесса 
$12е_$&К 94 0 : размер стека в байтах 
р ор да 0 ; адрес вершины стека 
$72е_1{ет 94 2 : размер элемента стека в байтах 
:; (по умолчанию 1 байт) 
Напа Неад 94 0 : описатель общей кучи процесса 
епд$ 
„Чата 
$г1п9 [#1 "а<а(КК{К)р>рр" ; строка для тестирования 
]_54г179 = $ - Ягну 

------ описание данных и строк сообщений 
„соде 

1------ описание макрокоманд работы со стеком 

: (см. файлы. прилагаемые к книге) 

1------ создание стека 
сгеате_51к ппасго  4езсг:ВЕС. 512е5К:=<256> 
епдт 


ЕЕ очистка стека 
111_51К масго  Чезсг:ВЕЦ 
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епат 


епат 


ризп_$ЕК° 
епт 


епат 


епт 
$фагЕ 


е х\: 
СУС1: 


т? : 


па: 
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удаление стека 
пасго  аезсг:КЕЦ | 
добавление элемента в стек 

пасго  Чезсг:КЕЦ. адг_{ет:ВЕЙ 

проверка стека на пустоту 

пасго  Чезсг:КЕЦ. Табе] _егг:ВЕД 

извлечение элемента из стека в область памяти 


пасго  Чезсг:ВЕЦ. адг_Тет: ВЕ 
извлечение элемента из вершины стека без его удаления оттуда 
пасго  @езсг:ВЕД. ааг_1фет:ВЕО 


ргосе  пеаг : точка входа в программу 


сгеабе_51К спаг_$&к ; создание стека 


анализируем строку 


оу есх. 1_51г1пд 

Теа ебх. $г1пд 

Зпр сус1 

ЗПР ех1т 

3х2 е хе 

стр Бие рёг [ебх]. "(" 
3е тм _ризй 

стр Бу е рёг [ебх1. "Г" 
3е м ризИ 

стр Буте рег [ебх1. "{" 
3е т_ри$И 

стр Буе рг [еБх]. "<" 
зе т рибИ 

стр уе рёг [еБх]. ")" 
Зпе п] 


извлекаем элемент из вершины стека и анализируем его 
ТезфЕтреу${К спаг_${К. тез _еггог 
рор_${К спаг_$1К. <оТР5её фетр> 


стр Тетр. "(" 

зте мез_еггог 

Зтр г пехё 

стр БуЕе рёг [еБх}. "]" 
зле т2 


извлекаем элемент из вершины стека и анализируем его 
ТезфЕтрёузК спаг_5{К. тез еггог 
рор_5{К сНаг_${К, <оРГзеё фетр> 


стр Тетр. "[" 

3пе тез_еггог 

Эир г_пехЕ 

стр Бе рёг Гебх]. "}" 
пе 3 


извлекаем злемент из вершины стека и анализируем его 
ТезфЕтртузК спаг_51К. мез_еггог 
рор_5{К спаг_${К. <оТР5её {етр> 


стр фетр. "{" 

зпе пез_еггог 

Зпр г_пехё 

стр Буе рёг [ебх]. ">" 
зле г пех 
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у------ извлекаем элемент из вершины стека и анализируем его 
ТезфЕтреу$К спаг_5%К. тез_еггог 
рор_5К спаг_$5ЕК. <оРР5её фетр> 


стр Сетр. "<" 
пе тез_еггог 
Зпр г пехё 
ее включение скобки в стек 
п ризН: ризН_5ЁК снаг_5К. ебх 
г_ пех: ааа ебх. спаг_51К.$12е_1фет 
дес есх 
тр Сус] 
------ вывод на экран сообщения об ошибке тез_е 
те_еггог: С 
Эр ех1{_ех1 
+----- проверяем стек на пустоту 
ех{: рор_5{К спаг_$К. <оТТР5еф фетр> 
Зпс мез_еггог : стек не пуст 
ЕЕ вывод на экран сообщения тез_оК 
;------ финализация 
ех_ех1е: ЧеТефе_$5&К сваг_${кК : удаляем блок памяти со стеком 


Код, выполняющий работу со стеком, оформлен в виде макрокоманд. При не- 
обходимости код можно сделать еще более гибким. Для этого нужно использовать 
функцию АРТ Я п 32 НеарКеАЦос, которая изменяет размер выделенного блока в сто- 
рону его увеличения или уменьшения. В принципе, полезной может оказаться опе- 
рация определения объема стека, то есть количества элементов в нем. Попробуйте 
реализовать ее самостоятельно. 


Очередь 

Очередь [2, 10, 15] — последовательный список, в котором включение элементов 
производится на одном конце, а исключение — на другом, то есть по принципу 
НЕО (ЕизЕ ш Еизё ОцЕ — первым пришел, первым ушел). Сторона очереди, на 
которой производится включение элементов, называется хвостом. Соответствен- 
но, противоположная сторона — голова очереди. Очередь описывается дескрипто- 
ром, который может содержать поля: имя очереди, адреса верхней и нижней гра- 
ниц области памяти, выделенной для очереди, указатели на голову и хвост. 

Набор операций для очереди: 


создание очереди (сгеа*е_дие); 

и включение элемента в очередь (ризН_дие); 

* исключение элемента из очереди (рор_дие); 

” проверка пустоты очереди (Тез#Етру(ие); 
очистка очереди без освобождения памяти для нее (п _дие); 
удаление очереди (Чеее_дие). 


При помощи очереди удобно моделировать некоторые обслуживающие дей- 
ствия, например это может быть некоторая очередь запросов к критическому ре- 
сурсу или очереди заданий на обработку. К очереди так же, как и к стеку, примени- 
мы такие параметры, как емкость очереди и размер элемента очереди. 

На практике используются очереди двух типов — простые и кольцевые. Очередь 
обслуживается двумя указателями — головы (Р,) и хвоста очереди (Р.) (рис. 2.11). 


120 Глава 2. Сложные структуры данных 


Указатель головы Р, идентифицирует самый старый элемент очереди, указатель 
хвоста — первую свободную позицию после последнего включенного в очередь 
элемента. Сами элементы физически по очереди не двигаются. Меняется лишь 
значение указателей. При включении в очередь новый элемент заносится в ячейку 
очереди, на которую указывает Р.. Операция исключения подразумевает извлече- 
ние элемента из ячейки очереди, указываемой Р,. Кроме извлечения элемента, опе- 
рация исключения производит корректировку указателя Р1 так, чтобы он указы- 
вал на следующий самый старый элемент очереди. Таким образом, указатель хвоста 
простой очереди всегда ссылается на свободную ячейку очереди и рано или по- 
здно он выйдет за границы блока, выделенного для очереди. И это случится не- 
смотря нато, что в очереди могут быть свободные ячейки (ячейки А,, А, на рис. 2.11, 
сверху). Чтобы исключить данное явление, очередь организуется по принципу 
кольца (рис. 2.11, снизу). В обоих способах организации очереди важно правильно 
определить ее емкость. Недостаточный объем очереди может привести в опреде- 
ленный момент к ее переполнению, что чревато потерей новых элементов, претен- 
дующих на включение в очередь. 

Для иллюстрации порядка организации и работы с очередью рассмотрим при- 
мер. Пусть имеется строка символов, которая следующим образом моделирует не- 
которую вычислительную ситуацию: символы букв означают запросы на некото- 
рый ресурс и подлежат постановке в очередь (имеющую ограниченный размер). 
Если среди символов встречаются символы цифр в диапазоне 1—9, то это означает, 
что необходимо изъять из очереди соответствующее значению цифры количество 
элементов. Если очередь полна, а символов цифр все нет, то происходит потеря 
заявок (символов букв). В нашей программе будем считать, что очередь кольцевая 
и ее переполнение, помимо потери новых элементов, приводит к выводу соответ- 
ствующего сообщения. Для кольцевой очереди возможны следующие соотноше- 
ния значений указателей Р1 иР, (рис. 2.11, снизу): Р, < Р„,Р, = Р. (пустая очередь), 
Р, >Р.. Память для очереди в нашей задаче выделяется динамически средствами 
АР! \Мп32. | 

Заметим, что, исходя из потребностей конкретной задачи, можно изменить дис- 
циплину обслуживания очереди. Например, установить, что при переполнении 
очереди потере подлежат старые заявки (в голове очереди) и т. п. 


Схема простой очереди 






Ячейка 


Р Р> 


— свободная ячейка 


— занятая ячейка 





Р»› — хвост Р; — голова 


Схема кольцевой очереди 
Рис. 2.11. Структура простой и кольцевой очередей 
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: Программа: рг902_10.азт. Пример приложения для М1п32 (работа с _ кольцевой, | 


й очередью) с использованием функций АРТ И1п32 для работы с кучей. | 


;| Имя очереди — имя экземпляра очереди. Перед обращением к макрокомандам | 
:| необходимо проинициализировать поля структуры $12е_дие и $12е_1фет дие. | 


яя + + 
дес ‚ дие $ёгис : дескриптор очереди 
р_ТагЕ_дие 94а 0 : адрес блока (начала области памяти 
: для очереди) из кучи процесса (А!) 
р епа дие 94 0 : адрес конца блока в общей куче 
; процесса (Атах) 
$12е_дие 94а 0 : размер очереди в байтах 
р! пеад 94а 0 : указатель головы очереди (Р1) 
ра 94 0 ; указатель хвоста очереди (Р2) 
$12е_Чет_дие @4 1 : размер элемента очереди в байтах 
: (по умолчанию 1 байт) 
Напа Неаа да 0 : описатель общей кучи процесса 
епа$ 
„Чата : 
спаг_дие дезс_дие <=> 
$&г1п9 [6]°) "ОТтугуд$ 49 аРЕ2ОТА9ОЕ7 ата Теееееебч т 9959414" 
]_56г1п9д = $ - $г19 
пез_е [ет "Очередь переполнена“ 
Теп_тез_е = $ - меб е 
.соде 
------ описание макрокоманд работы с очередью 
: (см. файлы. прилагаемые к книге) 
------ создание очереди 
сгеафе ‚ие пасго  Чезсг:ВЕЦ. 512е0ие: КЕЙ 
епдт 
----- удаление очереди 
дете ‚сие пасго  дезсг:ВЕО 
епдт 
------ добавление элемента в очередь [2] 
ризй_дие ппасго  Чезсг:ВЕО. адг_1фет:ВЕЙ 
епат 
;------ извлечение элемента из очереди [2] 
рор_дие пасго  Чезсг:ВЕЦ, а@г_1Фет: ВЕД 
епат 
ЕРАеЕВ очистка очереди (удаление всех злементов 
; без удаления самой очереди) 
1и1_дие пасго — Чезсг:КЕЦ 
епдт 


------ проверка очереди на пустоту 
тезнетрЕуие пасго  4е5сг:ВЕС 


епат 
ЗфагЕ ргос пеаг : точка входа в программу 


сгеайе_дие спаг_дие. 10 ; создание очереди 

------ читаем символы строки 

: +1 для обработки всех злементов. включая последний 
1еа е51. 5$4г1та 
оу есх. 1_5г1п9+1 
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ризп есх 
Зпр Сус] 
ех\щ: Зпр ех1т 
------ анализируем очередной символ строки 
сус1: рор есх 
3схг ех\ 
104$ : в а1 очередной символ строки 
дес есх 
ри$Н есх 
стр а1. 31и 
3 м1 
стр а1. З9и 
да 1 
------ удаляем из очереди элементы 
хог есх. есх 
ОУ СТ, а] 
5иБ с1. 308 ; преобразуем в двоичный эквивалент 
п2: рор_дие спаг_дие. <оТР5её {етр> 
3с Сус] : если очередь пуста 
Тоор тё 
Зпр сус1 
у------ добавляем элементы в очередь 
т]: оу Тетр. а1 
ризи_дие спаг_дие. <оТТ5еф Тептр> 
пс сус1 ; успех 


;----- вывод на экран сообщения об ошибке — 
отсутствие места в очереди 


Зпр сус1 
;----- выход из приложения. удаляем блок памяти с очередью 
ех1т: де1ете_дие спаг_дие 


Как и в случае со стеком, код, выполняющий работу с очередью, оформлен в 
виде макрокоманд. Программа выдает единственное сообщение о переполнении 
очереди. Чтобы наблюдать работу программы в динамике, необходимо выполнить 
следующие действия. 


1. Загрузить исполняемый модуль программы в отладчик &432.ехе. 


2. Отследить адрес начала блока памяти, который будет выделен системой по на- 
шему запросу для размещения очереди. Для этого подвергните пошаговому вы- 
полнению в окне СРЦ содержимое макрокоманды сгеаёе_дие. 


3. Выяснив адрес начала блока для размещения очереди, отобразите его в окне 
Витр и нажмите клавищу Е7 или 8. Не отпуская этой клавиши, наблюдайте за 
тем, как изменяется состояние очереди. 


Дека 


Дека [2, 13] — очередь с двумя концами. Дека является последовательным спис- 
ком, в котором включение и исключение элементов может осуществляться с лю- 
бого из двух концов списка. Логическая и физическая структуры деки аналогичны 
обычной очереди, но относительно деки следует говорить не о хвосте и голове, ао 
правом и левом конце очереди. Реализацию операций включения и исключения в 
деку следует также дополнить признаками левого или правого конца. В литерату- 
ре можно встретить понятие деки с ограниченным вводом. Это дека, в которой эле- 
менты могут вставляться с одного конца, а удаляться с обоих. 
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Связные списки 


Связный список — набор элементов, каждый из которых структурно состоит из двух 
частей — содержательной и связующей. Содержательная часть представляет со- 
бой собственно данные или указатель на область памяти, где эти данные содер- 
жатся. Связующая часть предназначена для связи элементов в списке и определя- 
ет очередность их следования. Благодаря связующей части в каждом из элементов 
становятся возможными «путешествия» по списку путем последовательных пере- 
ходов от одного элемента к другому. 

В отличие от последовательного списка связный список относится к динами- 
ческим структурам данных. Для них характерны непредсказуемость в числе эле- 
ментов, которое может быть нулевым, а может и ограничиваться объемом доступ- 
ной памяти. Другая характеристика связного списка — необязательная физическая 
смежность элементов в памяти. 

Относительно связующей части различают следующие типы связных списков. 


# Односвязный список — список, начало которого определяется указателем нача- 
ла, а каждый элемент списка содержит указатель на следующий элемент. Но- 
следний элемент должен содержать признак конца списка или указатель на пер- 
вый элемент списка. В последнем случае мы имеем односвязный кольцевой 
список. Его преимущество состоит в том, что просмотр всех элементов списка 
можно начинать с любого элемента, а не только с головы. Более того, в случае 
кольцевого односвязного списка указателем его начала может быть любой эле- 
мент списка. Этот вид списка всегда линейный, так как однозначно задает по- 
рядок своего просмотра. 

\ Двусвязный список — список, связующая часть которого состоит из двух указа- 
телей — на предыдущий и последующий элементы. Начало и конец списка опре- 
деляются отдельными указателями. Последние элементы двусвязного списка в 
каждом из направлений просмотра содержат признаки конца. Если замкнуть 
эти указатели друг на друга, то мы получим кольцевой двусвязный список. 
В этом случае потребность в указателе конца списка отпадает. Такой вид спис- 
ка может быть как линейным (иметь одинаковый порядок просмотра в обоих 
направлениях), так и нелинейным (второй указатель каждого элемента списка 
задает очередность просмотра, которая не является обратной порядку, устанав- 
ливаемому первым указателем). 


® Многосвязный список — список, связующая часть элементов которого в общем 
случае содержит произвольное количество указателей. В этом виде списка каж- 
дый элемент входит в такое количество односвязных списков, сколько он име- 
ет в себе полей связи. 


В общем случае для связанных списков определены следующие операции [3]: 
\ создание связного списка; 


включение элемента в связный список, в том числе и после (перед) определен- 
ного элемента; 


и доступ к элементу связного списка (поиск в списке); 
я исключение элемента из связного списка; 
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* упорядочение (перестройка) связного списка; 
" очистка связного списка; 
* проверка объема списка (числа элементов в связном списке); 
* объединение нескольких списков в один; 
* разбиение одного списка на несколько; 
"” копирование списка; 
" удаление связного списка. 
Связные списки очень важны для представления различных сетевых структур, 
в частности деревьев, что и будет рассмотрено нами чуть ниже. Пока же рассмот- 


рим работу с некоторыми из обозначенных нами типов связных списков на прак- 
тических примерах. 


Односвязные списки 


В простейшем случае односвязный список можно организовать в виде двух одно- 
мерных массивов, длины которых совпадают и определяются максимально допус- 
тимой длиной списка. Поля первого массива содержат собственно данные, а соот- 
ветствующие поля второго массива представляют собой указатели. Значением 
каждого из этих указателей является индекс элемента первого массива, который 
логически следует за данным элементом, образуя таким образом связанный спи- 
сок. В качестве примера рассмотрим программу, которая в некотором массиве свя- 
зывает все ненулевые элементы, а затем как полезную работу подсчитывает их ко- 
личество. В последний единичный элемент в качестве признака конца списка 
заносим ОЙВ. 


;| Программа: ргд3_10.азт. Пример реализации односвязных слисков ] 
| с помощью двух массивов. ] 


а 
ма5 9 0. 55. 0. 12. 0. 42. 94. 0. 18.0. 6 
[в 67. 0, 58, 46 —: задаем массив 
п = $ - паб 
роте [6 0 ; указатель списка — индекс первого 
; ненулевого элемента в таз 
р [ео п @ф (60) : определим массив указателей 
.соде 
Теа 51. Ма$ : в $1 адрес таз ро1итё 
хог Ьх. Бх ; в Бх будут индексы — кандидаты на 
; включение в массив указателей 
ЗЕНЕЕЕ ищем первый ненулевой элемент 
Ш сх. п -1 
сус11: стр Буе рёг [$1)[6х]. 0 
те 1 : если нулевые элементы. продолжим 
Тис Ьх 
Тоор сус11 
Зпр ех1е : если нет ненулевых элементов 
т: оу ротпё. Ы1 : запоминаем индекс первого ненулевого 
оу 91. 6х ; В 91 индекс предыдущего ненулевого 


:------ просматриваем далее (сх тот же) 
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тис Бх 
сус12: стр Буе рёг [51 ИЬ]. 0 

3е т2 : нулевой => пропускаем 

1------ формируем индекс 
| паз _ро1и[ 91], Ь1 ; индекс следующего ненулевого 
; в элемент та$_ро1иё предыдущего 

оу 1. 6х ; запоминаем индекс ненулевого 
п2: тис Бх 

Тоор сус12 

| паз ротиё[91]. ОИ :индекс следующего ненулевого 


: в элемент та$_ро1пЕ 
;------ а теперь подсчитаем единичные. не просматривая все. — 
: результат в ах 


хог ах. ах 
стр ро1пё. 0 
3е ех{ 
лис ах 
оу Ы. роттЕ 

сус13: стр таз ротиЕ[Ьх], О 
3е ех1ё 
Шо ах 
Де) Ы. ма$_ротиЬх] 
Зпр сус13 


1------ результат подсчета в ах. с ним нужно что-то делать. 
иначе он будет испорчен 


Если количество нулевых элементов велико, то можно сократить объем хране- 
ния данного одномерного массива в памяти (см. ниже материал о разреженных 
массивах). 

Кстати, в качестве еще одного реального примера использования односвязных 
списков вспомните, как реализован учет распределения дискового пространства 
в файловой системе М$ РО$ (ЕАТ). 

Далее рассмотрим другой, более естественный вариант организации связанно- 
го списка. Его элементы содержат как содержательную, так и связующую части. 

Рассуждения относительно содержательной составляющей пока опустим — они 
напрямую зависят от конкретной задачи. Уделим внимание связующему компо- 
ненту. Понятно, что это адреса. Но какие? Будем считать, что существуют два типа 
адресов, которые могут находиться в связующей части: абсолютные и относитель- 
ные. Абсолютный адрес в конкретном элементе списка — это, по сути, смещение 
данного элемента относительно начала сегмента данных или блока данных при 
динамическом выделении памяти и принципиально он лишь логически связан со 
списком. Относительный адрес формируется исходя из внутренней нумерации 
элементов в списке и имеет смысл лишь в контексте работы с ним. Пример относи- 
тельной нумерации рассмотрен выше при организации списка с помощью двух 
массивов. Поэтому далее этот способ мы рассматривать не будем, а сосредоточим- 
ся на абсолютной адресации. 

Для начала разработаем код, реализующий применительно к односвязным спис- 
кам основные из обозначенных нами выше операций со связанными списками. 
Односвязные списки часто формируют с головы, то есть включение новых эле- 
ментов производится в голову списка. 

Первая проблема — выделение памяти для списка. Это можно выполнить либо 
статическим способом, зарезервировав место в сегменте данных, либо динамиче- 
ски, то есть так, как мы это делали выше при реализации операций со стеками и оче- 
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редями. Недостатки первого способа очевидны, хотя в реализации он очень прост. 
Гораздо интереснее и предпочтительнее второй вариант, который предполагает 
использование кучи для хранения связанного списка. Для придания большей реяа- 
листичности изложению рассмотрим простую задачу: ввести с клавиатуры сим- 
вольную строку, ограниченную символом "." (точка), и распечатать ее в обратном 
порядке. 


Е о О С Ч КЕ ма + 
ее $гис : элемент списка 
пех 94 0 : адрес следующего элемента 
ве) [1%] 0 : содержательная часть (у нас — символ) 
еп0$ 
.дата 
ма$ [в ВО @р (°') ; в эту строку вводим 
пмаз_геу 4 80 ар С°) ; из этой строки выводим 
1Теп_таз_геу = $ - маз_геу 
тез1 [9 'Введите строку символов (до 80) для инвертирования ' 
[6 ‘(с точкой на конце): * 
1еп_пе51 = $ - пе$1 
.соде 
и описание макрокоманд работы со связанным списком 
------- создание списка — формирование головы списка и первого элемента 
сгеа{е_ 115 тасго  Фезсг:КЕЦ. пеад:КЕО 
епдт 
ыы добавление элемента в связанный список 
а09 115+ пасго  Чезсг:ВЕО. Неад:ВЕО. Н Нега: ВЕС 
епдт 


------ создание элемента в куче для последующего добавления в список 
сгеате_ Нет пасго  Чезсг:КЕЦ. Н Неа@:ВЕО 


епат 
Зфаге ргос пеаг ; точка входа в программу 
1------ вывод строки текста — приглашения на ввод строки 
: для инвертирования 
------ вводим строку в таз 
------ создаем связанный список. 
сгеафе_1151 1{ет 115. Неад 115+ 
у------ первый элемент обрабатываем | отдельно 
Теа е51. таз 
том а1. [е$1] 
стр 21.5. 
3е геу ош 
оу [еБх].1пРо. а1 
1------ вводим остальные символы строки с клавиатуры до тех пор 
$ пока не встретится "." 
Сус: Тис е$1 
том а1. [е$1] 
т а тай 
геу од 


ет 115% ет 115. НеаЧ 1156. Нап@ Неад 
оу еБх].1пто. а1 


пипеткой а о инь 
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Зтр сус1 
РЕЯ вывод строки в обратном порядке 
гем_оцё: 1еа е51. таз_геу 
Де еБх. Неа@_115+ 
сус12: оу а1. [еБх]. ито 
поу [е51]. а1 
1пс е$1 
поу ебх. [еБх] пех 
стр ебх. ОТЕЕЕРЕЕЕ 
пе сус12 


------ выводим инвертированную строку на экран 


Недостаток такого способа построения списка — в порядке включения элемен- 
тов. Хорошо видно, что он является обратным в очередности поступления элемен- 
тов. Для исправления данной ситуации можно, конечно, ввести еще один указа- 
тель на последний элемент списка. Есть и другой вариант — организация двусвязного 
списка. Уделим теперь внимание другим операциям с односвязным списком. 


Включение в список 


Для включения нового элемента в список необходимо предварительно локализо- 
вать элемент, до или после которого будет производиться это включение. Для того 
чтобы вставить новый элемент после локализованного, необходимо выполнить 
действия, отраженные фрагментом кода: 


ет_115% $гис : элемент списка 

пех 04 0 : адрес следующего элемента 

тГО [в 0 ; содержательная часть (у нас — символ) 
епа$ 


-=---- предполагаем. что адрес локализованного элемента 
: находится в регистре ЕВХ. а адрес нового элемента — в ЕАХ 


пом. еах. [еБх}.пехЕ 
оу [еах).пехё, е@х 
оу [еБх).пехё. еах 


При вставке нового элемента после локализованного возникает проблема, ис- 
точник которой в однонаправленности односвязного списка, так как, по определе- 
нию. проход к предшествующему элементу невозможен. Можно, конечно, вклю- 
чить новый элемент, как показано выше, а затем попросту обменять содержимое 
этих элементов. К примеру, это может выглядеть так: 


Теет_11$% $&гис ; элемент списка 

пехё 94 0 ; апрес следующего элемента 

тю дБ 0 : содержательная часть (у нас — символ) 
еп 


ЕЕ предполагаем. что адрес локализованного элемента находится 
: в регистре ЕВХ. а адрес нового элемента — в ЕАХ 


Де ефх. [еБх] пех 
оу [вах] .пехё, едх 
оу едх. [ебх].1пто 
моу [еах].1пфо, едх 
оу [ебх] .пехе. еах 


ах осталось заполнить поле 1пРо нового элемента 


Но если производится включение в упорядоченный список, то логичнее рабо- 
тать с двумя указателями — на текущий и предыдущий элементы списка так, как 
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это показано ниже. При этом предполагается, что новый элемент создается опи- 
санной в предыдущей программе макрокомандой сгеайе_Иет. 


бет_11$% 
пехё 

Тито 

епд5 
„Чата 
11$_Цет 


Неа _11$% 


Напа Неад 
.соде 


м1: 


1ифо: 


ех\: 


$гис ; элемент списка 
да 0 ; адрес следующего элемента 
[6] 0 : содержательная часть (у нас — символ) 
Тбет_11$% <.15> ; вставляемый элемент (поле 1иТо 

: содержит значение — критерий вставки) 
94 ОРЕЕЕЕЕЕТИ ; указатель на начало списка 

; (ОРРЕЕЕЕЕРИ — список пуст) 
94 0 : переменная для дескриптора кучи 


Инициализация списка и работа с ним. 
список упорядочен по возрастанию 


ищем место вставки 
1 - выбираем первую ячейку 


Де ебх. Неа@_115% 

хог еах. еах ; будет указатель на предыдущий элемент 
стр ебх. ОРЕЕЕЕЕЕИ : 2 - последняя ячейка? 

Зе по_1фет ; список пуст 

3 — новая ячейка до очередной выбранной? 

пом 91. [е6х] .1п®Ю 

стр 91. 1т5_Тет. Тибо 

За пёхё_1{ет 

те5е еах. еах 

72 110 


вставить первым 
сгеа{е_\ет 1{ет 115%. Н Неа ; создание элемента в куче 


ше) Неад 115%. едх : апрес нового в голову списка 
ше. [едх].пехе, еБх ; настройка указателей 
Змр ех1{ ; на выход 


вставить внутрь списка 
сгеасе {ет (ет 115%. Н Неа : создание элемента в куче 


Де) [еах].пехё. е4х ; адрес нового в поле пехё предыдущего 
пом [едх].пехё, ебх ; в поле пехё нового адрес текущего 
Зир ех1 ; на выход 

выбор очередного элемента 

ЮУ еах. ебх : адрес текущего в еах 

тоу ебх. [еБх].пехё 

пр 11 


4 - список пуст или нет больше элементов 
тезт еах. еах 


372 по_етрёу ; список непустой 

список пуст 

оу НеаЧ 115 .едх ; адрес нового в голову списка 

оу [едх].пехе. ОРЕЕЕЕЕТЕИ ; пока единственный элемент 
Эр ех1{ ; на выход 

список не пуст — новая ячейка в конец списка 

оу [еах] .пехё. едх 

оу [е4х].пехё. ОТЕЕЕЕЕЕТИ : последний элемент в списке 


ВЫХОД 


Исключение из списка 

Алгоритм предполагает наличие двух указателей — на текущую и предыдущую 
ячейки. Для разнообразия этот алгоритм подразумевает прямой порядок следова- 
ния элементов в списке. В качестве упражнения читателю предлагается, если нуж- 
но, переписать приводимый ниже фрагмент для организации обратного порядка 
следования элементов. 





Список 129 


Тбет_1151 $Егис : элемент списка 
пехё [ве 0 ; адрес следующего элемента 
тято [е]) 0 ; содернательная часть (у нас — символ) 
епа$ 
„дата 
зеагсй_Б |9) 0 ; критерий поиска (поле тпТо экземпляра 
; структуры 1%ет_1151) 
Неа@_11$% 99 ОРРЕГЕСЕТИ : указатель на начало списка 
; (ОРРРЕЕЕЕР — список пуст) 
.соде 
+ - Инициализация списка и работа С ним. 
: список упорядочен по возрастанию 
тент ищем ячейку. подлежащую удалению 
ее 1 - выбираем первую ячейку 
моу ебх. Неад 115% 
хог еах, еах : будет указатель на предыдущую ячейку 
;----- 2 - последняя ячейка? 
стр ебх. ОРЕЕЕЕЕЕРИ 
де по_1ет 
нЕ сравниваем с критерием поиска 
СУС1: оу 91. зеагси_Б 
стр [ебх}.1пТо. 91 
Зпе сн_пехе_1ет ; нашли? 
:----- да. нашли! 
те5е еах. еах 
3" по_115% ; это не первая ячейка 
у+---- первая ячейка(?) => изменяем указатель 
; на начало списка и на выход 
оу едх. Гебх].пехё 
оу Неад 1156. е@х 
Зтр ех{ 
по_ 1151: мо [еах] .пехё, ебх ; перенастраиваем указатели => 
: элемент удален 
дар ех1е ; на выход 
ет выбор следующего элемента 
си пехе_14ет:  поу еах. еБх ; запомним адрес текущей ячейки 
; в указателе на предыдущую 
том ебх. [ебх].пехЕ : адрес следующего элемента 
Зпр Сус] 
;----- обработка ситуации отсутствия элемента 
по_Тет: в 


Остальные обозначенные нами выше операции очевидны и не должны вызвать 
у читателя трудностей в реализации. 

Другой интересный и полезный пример использования односвязных списков — 
работа с разреженными массивами. Разреженные массивы представляют собой 
массивы, у которых много нулевых элементов. Представить разреженный массив 
можно двумя способами: с использованием циклических списков с двумя полями 
связи (рис. 2.12) и посредством хэш-таблицы. 

С разреженными массивами можно работать, используя методы хэширования. 
Для начала нужно определиться с максимальным размером хэш-таблицы (М) для 
хранения разреженного массива. Это значение будет зависеть от максимально воз- 
можного количества ненулевых элементов. Ключом для доступа к элементу хэш- 
таблицы выступает пара индексов (1,7), где: = 1...р,] = 1..4. Числовое значение ключа 
вычисляется по одной из следующих формул: 

К=:+а:0-0-1, 
К=у+р. (1-1) -1. 
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Элемент списка 
для хранения элемента 
х а, матрицы А 
от элемента а,;; | а | ое 
© 1+1 
от элемента а,.; Г © колементу а»; 
Массив 
указателей 
столбцов 
а, ——> аз 
ат > атл-1 


Рис. 2.12. Структура хранения разреженной матрицы при помощи списков 


Остальные действия зависят от избранного способа вычисления хэш-функции 
(см. выше соответствующий раздел о методах хэширования). 


Двусвязные списки 

Двусвязный список представляет собой список, связующая часть которого состо- 
ит из двух полей. Одно поле указывает на левого соседа данного элемента списка, 
другое — на правого. Кроме этого, со списком связаны два указателя — на голову 
и хвост списка (рис. 2.13, сверху). Более удобным может быть представление спис- 
ка, когда функции этих указателей выполняет один из элементов списка, одно из 
полей связи которого указывает на последний элемент списка (рис. 2.13, снизу). 





ей и ПОНЕ — переменные-указатели 





Рис. 2.13. Схемы организации двусвязных списков 


Преимущество использования двусвязных списков — в свободе передвижения 
по списку в обоих направлениях, в удобстве исключения элементов. Возникает 
вопрос о том, как определить начало списка. Для этого существуют по крайней 
мере две возможности: определить два указателя на оба конца списка или опреде- 
лить голову списка, указатели связей которой адресуют первый и последний эле- 
мент списка. В случае двусвязного списка добавление и удаление элементов про- 
изводятся простой перенастройкой указателей. Проиллюстрируем это на примере 
задачи с обратным выводом вводимой с клавиатуры строки, рассмотренной в раз- 
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деле, посвященном односвязным спискам. Это позволит сравнить порядок выпол- 
нения типовых операций над списками и эффективность работы с ними. Структу- 
ру списка определим как двусвязный список с головой, содержащей указатели на 
О 


Е ре ее а Е ей а ао а а Ее + 

а $ёгис : элемент списка 

ргеу [ее] 0 ; адрес предыдущего элемента 

19го [в] 0 : содержательная часть у нас — символ) 

их [6 0 ; апрес следующего элемента 

епд$ 

Неад_11$% $фгис ; заголовок списка 

г 99 0 : адрес первого элемента списка 

1ято ЧБ ОИ ; ОЕ — признак заголовка списка 

}а5 аа 0 ; адрес последнего элемента списка 

еп 

„даа 

па$ ЧБ 80 аир {'') : в эту строку вводим 

пмаз_геу [6 80 др (°°) : из этой строки выводим 
1еп_таз_геу = $ - таз _ геу 

те$1 [6] ‘Введите строку символов (до 80) для инвертирования ‘ 
[в (с точкой на конце): * 


]еп_тез1 = $ - тез] 
.соде 
------ описание макрокоманд работы со связанным списком 
: (см. файлы. прилагаемые к книге) 
------ создание двусвязного списка 
сгеае _ЧомбЛу_ 1151 тмасго Пеад:ВЕ0 


епат 
+= добавление элемента в двусвязный список 
ад4 115% пасго  Чезсг:КЕО. Неа :ВЕО. Н_Неад: ВЕС 
ета 
5фагЕ ргос пеаг ; точка входа в программу 
;------ вывод строки текста — приглашение 
; на ввод строки для инвертирования 
1------ вводим строку текста для инвертирования 
------ создаем связанный список, для чего 
: инициализируем заголовок списка 
сгеабе_доиб1у_115Е Ооц6Ту_Неад_11$% 
------ вводим символы строки с клавиатуры до тех пор. 
. пока не встретится "." 
Теа е51. таз 
Сус]: оу а1. [е51] 
г а". 
геу_о 
ми: 115 Иет_ Е ОоцБТу_Неаа 115+. Напд_Неад 
оу ^ [еБх1. 1ито, а] 
тс е51 
Зир сус1 
1------ вывод строки в обратном порядке 
геу_ сиё: Теа е51. та геу 


оу ебх. боуб1у_Неа4_115% .1а5% 
сус12: оу а1, [еБх].1пто 
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оу [е$1]. а1 

ТИС е51 

МОУ ебх. [ебх] .ргеу 

стр Гебх).1пРо, ОТ ; дошли до последнего элемента списка? 
зле сус12 


а-я = выводим инвертированную строку на экран 


Включение в список 

Для добавления нового элемента в список необходимо предварительно локализо- 
вать элемент, до или после которого будет производиться это включение. Для ТОГО 
чтобы вставить НОВЫЙ элемент после локализованного, то есть <справа», необхо- 
димо выполнить действия, отраженные фрагментом кода: 


Цет_11$% 5@гис ; элемент списка 

ргеу 99 0 : адрес предыдущего элемента 

ее) [#19] 0 ; содержательная часть у нас — символ» 
ыы 83 0 ; адрес следующего элемента 

епд$ 


1++=--- предполагаем. что адрес локализованного элемента 
я находится в регистре ЕВХ. а адрес нового элемента — в ЕАХ 


ризВ Гебх] .пехё 


рор [еах] .пехё ; [еБх] .пехё->[еах] .пехё 
МОУ [еах].ргеу. еБх : адрес предыдущего элемента->[еах].ргеу 
МОУ [ебх).пехё. еах : адрес следующего злемента->[еЪх] .пехё 


------ будьте внимательны — меняем указатель предыдущего элемента 
в следующем за новым элементом 
ЮУ ебх. [еах].пехё : адрес следующего элемента->[еБх] .пехё 
оу [ебх].ргеу. еах ; адрес предыдущего злемента->[еБх].ргеу 


Включение элемента перед локализованным элементом выполняется аналогич- 
но. Простота работы с двусвязными списками в отличие от односвязных достига- 
ется за счет отсутствия проблем с передвижением по списку в обе стороны. 


Исключение из списка 

Аналогично включению, исключение из двусвязного списка не вызывает проблем 
и достигается перенастройкой указателей. Фрагмент программы, демонстрирую- 
щей эту перенастройку, показан ниже. 


бет 115% $гис : элемент списка 

ргеу [ 0 ; адрес предыдущего элемента 

ито [е1°) 0 ; содержательная часть у нас — символ) 
пехё [ее 0 : адрес следующего элемента 

епд$ 


ан - предполагаем. что адрес локализованного элемента 
. находится в регистре ЕВХ. а адрес нового злемента — в ЕАХ 


ЮУ еах. [ебх].ргеу : адрес предыдущего элемента -> еах 
ризН [ебх] .пехЕ 
рор [еах} .пехЕ 
ЮУ еах. Гебх].пехё : адрес следующего эллемента -> еах 
ризН [еБх] .ргеу 
рор [еах] .ргеу 


В общем случае одно- и двусвязные списки представляют собой линейные свя- 
занные структуры. Но в некоторых ситуациях второй указатель двусвязного спис- 
ка может задавать порядок следования элементов, не являющийся обратным по 
отношению к первому указателю (рис. 2.14). 





Рис. 2.14. Логическая структура нелинейного двусвязного списка 


Граф 


Неважно, что кто-то идет неправильно, 
возможно, это хорошо выглядит... 


Первый закон Скотта (Прикладная Мерфология) 


Выше мы уделили достаточно внимания работе с матрицами и списками, и это 
сделано не случайно. Еще более обобщая понятие списка, мы придем к определе- 
нию многосвязного списка, для которого характерно наличие произвольного ко- 
личества указателей на другие элементы списка. Можно говорить, что каждый кон- 
кретный элемент входит в такое количество односвязных списков, сколько у него 
есть указателей. Многосвязный список получается «прошитым» односвязными 
списками, поэтому такие многосвязные списки называют прошитыми, или плек- 
сами. С помощью многосвязных списков можно моделировать такую структуру 
данных, как граф (сеть). Частный случай графа — дерево. Рассмотрим варианты 
представления в памяти компьютера этих структур данных. 

Графом называется кортеж С = (У, Е), где У — конечное множество вершин, Ё — 
конечное множество ребер, соединяющих пары вершин из множества И. Две вер- 
шины и и 9 из множества У называются смежными, если в множестве Е существует 
ребро (м, ©), соединяющее эти вершины. Граф может быть ориентированным и не- 
ориентированным. Это зависит от того, считаются ли ребра (и, о) и (в, и) разными. 
В практических приложениях часто ребрам приписываются веса, то есть некото- 
рые численные значения. В этом случае граф называется взвешенным. Для каж- 
дой вершины о у графа есть множество смежных вершин, то есть таких вершин и, 
(1=1...п), для которых существуют ребра (о, и,). Это далеко не все определения, 
касающиеся графа, но для нашего изложения их достаточно, так как его цель — 
иллюстрация средств ассемблера для работы с различными структурами данных. 
Поэтому рассмотрим варианты представления графа в памяти компьютера в виде, 
пригодном для обработки. Какой из этих вариантов лучше, зависит от конкретной 
задачи. Мы также не будем проводить оценку эффективности того или иного вида 
представления. 


Матрица смежности. Граф, имеющий М вершин, можно представить в виде 
матрицы размерностью М х М. При условни, что вершины помечены как 5, 8, 
..› о„› Значение матрицы а, = 1 говорит о существовании ребра между вершина- 
ми и, и о. Иначе говоря, эти вершины являются смежными. Для ориентирован- 
ного графа матрица смежности будет симметричной. 
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”_ Матрица инцидентности. В основе этого представления также лежит матрица, 
но строки в ней соответствуют вершинам, а столбцы — ребрам (рис. 2.15). Из 
рисунка видно, что каждый столбец содержит две единицы в строках, причем 
одинаковых столбцов в матрице нет. 


1 12345 
1|о1011 

2 4 2] 10111 
6: Аб): з|о1001 
4| 11000 

5 3 5| 11100 


Рис. 2.15. Представление графа матрицей инцидентности 


— 
ши «< 
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Рис. 2.16. Представление графа векторами смежности 


Векторы смежности. Этот вариант представления также матричный (рис. 2.16). 
Все вершины пронумерованы. Каждой вершине соответствует строка матри- 
цы, в которой перечислены номера вершин, смежных с данной. 


" Списки смежностей. Каждой вершине графа сопоставлен односвязный список, 
элементы которого включают в себя по крайней мере два поля — с номером 
смежной вершины и указателем на следующий элемент. 


В качестве примера рассмотрим использование графа для представления диаг- 
рамм состояний дискретных систем. Здесь под дискретной системой понимается 
любая система, представимая моделью с конечным числом состояний [16]. Навход 
системы может поступать некоторое количество входных переменных, которые 
призваны оказать определенное воздействие на дискретную систему. Реакция по- 
следней выражается в том, что устанавливаются в определенные значения выход- 
ные переменные. Значения всех переменных (входных и выходных) меняются 
дискретно, то есть через определенные тактовые моменты, между которыми пове- 
дение системы не изменяется. Подобные системы удобно изображать в виде «чер- 
ного ящика». Элементарный пример дискретной системы — настольная лампа с 
выключателем. Входная переменная — положение выключателя со значениями 
«включено» и «выключено», выходная переменная — состояние лампы «горит» и 
«не горит». Строго говоря, такое определение дискретной системы больше подхо- 
дит для специального класса систем, называемых конечными автоматами. Для нас 
они важны тем, что их используют при разработке компиляторов для распознава- 
ния строк входного языка. 
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Формально конечный автомат задается следующим кортежем: М = {К, А, Р,5, ЕЁ, 
где: 
 К-— конечное множество состояний; 
А — конечный входной алфавит; 
* Р— множество переходов; 
” 5 — начальное состояние; 
" Е— множество последних состояний. 


“Действительно, представим, что есть некоторая программа — сканер, на вход 
которой поступают лексемы из исходного текста программы. Назначение скане- 
ра — дать ответ о принадлежности некоторой лексемы входному языку компиля- 
тора. Принципиально сканер функционирует так. Он имеет конечное множество 
состояний, одно из которых является начальным 5, и несколько конечных Р. Перед 
началом обработки символов очередной лексемы сканер находится в состоянии 5. 
По мере считывания очередной литеры лексемы состояние сканера меняется. Эти 
переходы также заранее определены множеством правил перехода Р. После окон- 
чания чтения лексемы автомат должен оказаться в одном из конечных состояний, 
некоторые из которых могут соответствовать состоянию ошибки. Исходя из того, 
в каком из состояний оказался сканер, он делает вывод о принадлежности лексе- 
мы входному языку. Если лексема ошибочная, то компилятором формируется со- 
ответствующее диагностическое сообщение, если же лексема корректная, то далее 
она в зависимости от своего типа подвергается дальнейшей обработке. 

Существуют два подхода к программированию конечного автомата — задавать 
его поведение в табличном виде и с помощью многосвязного списка. Мы не будем 
обсуждать их достоинства и недостатки, тем более что у них одна цель. Воспользу- 
емся же мы тем, что программирование поведения конечного автомата является 
удобным примером для иллюстрации применения многосвязных списков. 

В качестве примера рассмотрим фрагмент сканера для распознавания веще- 
ственных чисел в директивах ассемблера 94, 84, 4. Правило описания этих чисел 
в виде синтаксической диаграммы приведено в главе 17 «Архитектура и програм- 
мирование сопроцессора» учебника. Ему соответствует показанное ниже регуляр- 
ное выражение и детерминированный конечный автомат (рис. 2.17): 

(+|-)99*.44*е(+|-)94* 

Здесь 4* обозначает цифру 0-9 или пустое значение. 

Программа будет состоять из двух частей: 

* построение списка — здесь выполняется построение многосвязного списка по 
заданному регулярному выражению; 
» обработка входной строки на предмет выяснения того, является ли она пра- 

вильной записью вещественного числа в директивах ассемблера 04, 44, 0. 

При реализации первого пункта возникает проблема — как задавать элемент 
многосвязного списка, если в общем случае различные элементы списка могут 
иметь разное количество связей? Как показано на рисунке, различные состояния 
имеют разное количество связей. Можно предложить разные подходы к вы- 
бору программной реализации этих связей. Выберем следующий. Организуем все 
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Детерминированный 
конечный автомат 


Грамматика (правила) 
$0 > +5, | - $1 4$. 
$, > 45 

$2 № .5;19$ 

$3 >35. 

$. >е5; [954 

$5 > +55 | -5%5 145, 


$5 > 45, 
5) > 95, |4 Состояние 
отказа 
(ошибка) 


Конечное 
состояние 
(успех) 





Рис. 2.17. Грамматика языка описания вещественных чисел в директиве 99 
и соответствующий ей детерминированный конечный автомат 


исходящие связи каждого конкретного элемента в односвязный список. В этом слу- 
чае многосвязный список будет содержать элементы двух типов: 


описывающие состояния автомата — они организованы в двусвязный список; 


- описывающие ссылки или переходы от данного состояния к другим состояни- 
ям в зависимости от очередного входного символа — эти ссылки структуриро- 
ваны в виде односвязных списков для каждого из состояний. 


В случае нелинейной организации двусвязного списка его построение таит ряд 
проблем. Часть из них снимается при статическом способе построения списка, кото- 
рый для конечных автоматов является наилучшим. При необходимости, исполь- 
зуя приведенные ниже структуры, читатель может самостоятельно описать такой 
список в своем сегменте данных. Далее мы займемся динамическим, более слож- 
ным вариантом построения нелинейного списка, реализующим конечный автомат. 
Напомним, что его задачей является распознавание лексемы — описания веще- 
ственного числа в директивах ассемблера 44, 94, 4+. Для построения нелинейного 
многосвязного списка разработаем ряд макрокоманд. С их помощью построение 
проводится в два этапа: 


= создание двусвязного списка состояний конечного автомата; 
= создание односвязных списков переходов. 


В приведенной ниже программе двусвязный список состояний конечного авто- 
мата строится сразу. Далее для каждого состояния, в котором может находиться 
автомат, конструируются односвязные списки переходов. По мере своего созда- 
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ния односвязные списки переходов подсоединяются к соответствующим элементам 
двусвязного списка состояний конечного автомата. В конце программы производит- 
ся распознавание строки на предмет ее принадлежности к множеству строк, описы- 
ваемых приведенным выше регулярным выражением для вещественного числа. 


Создание двусвязного списка состоянии 
конечного автомата 

Опишем структуру элементов списка состояний и макрокоманду для его построе- 
ния. Особенность в том, что указатель списка содержит ссылку на последний вы- 
деленный элемент списка, что на самом деле особого значения не имеет 
Зет_115_$Тафе $фгис : элемент списка состояний 


ргем Кафе 99 0 ; адрес предыдущего элемента состояния 
14 $тате_$4ае 4 0 ; идентификатор состояния — 

; двоичное значение (0...п) 
сиггепЕ_51е 49 0 : адрес элемента текущего состояния 
ро1пЕ_сго$$ [6 0 ; указатель на начало списка переходов 

; Для этого состояния 
еп0$ 

неее + 


: и Напа Неа - дескриптор кучи процесса по умолчанию. ] 
дезсг — имя структуры-элемента списка состояний. 
М $Тафе - количество состояний. 


сгеабе_115 °бафе масго Нап@_Неад:ВЕО. Чезсг:КЕО, Неаа:КЕО. № зфафе:ВЕЙ 
---*-- сохраняем регистры 
ризпаа 
+= используем кучу. выделяемую процессу по умолчанию (1 Мбайт). 
но при необходимости можно создать и дополнительную кучу с помощью 
НеарСгеафе НАМОЕЕ и беРгосе$$Неар (МОТО): 


са11 беРгосе$$Неар 
ОУ Напа Неад. еах : сохраняем дескриптор 
ВЕЕЕНЕ Е запрашиваем и и блоки памяти из кучи 
хог ебх. ебх ; здесь будут указатели на предыдущие элементы 
хог есх. есх ; СТ - номер элемента состояния (двоичный) 


гере М °тате 
----- (Р\ОТО НеарАТос(НАМОСЕ ПНеар. ОМОВО @мЕ1ад$. ОМОВО диВутез) 


ризН есх 

рип фуре 4езсг : размер структуры 

ризИ 0 : флаги не задаем 

ризп Напа Неаа : описатель кучи 

са11 НеарА\1ос 

ОУ [еах] .ргеу_ Табе. ебх ; запоминаем адрес предыдущего 
; (если ебх=0. то это первый) 

ОУ еБх. еах ; запоминаем адрес текущего в ебх 

то\ [еах] .сиггепё_ бабе. еах ;и в Чезсг.сиггепе_5фафе 

рор есх 

поу [еах].14 $бабе Табе. с1 

1пС с1 


етот 
ут----- указатель на последний элемент списка состояний 
в поле-указатель на начало списка Пеад 


ет пеаЧ. ебх 
1------ восстанавливаем регистры 
рорад 


епдт 
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Создание односвязного списка переходов 
для состояния конечного автомата 


Также опишем структуру элемента списка переходов и макрокоманду для созда- 
ния этого элемента. Особенность в том, что, в отличие от списка состояний, макро- 
команда строит не весь список, а только один его элемент. Другая особенность — 
указатель на полученный односвязный список является ссылкой на последний 
выделенный элемент списка и именно к этому элементу осуществляется привязка 
элемента состояния к своему списку переходов, что на самом деле особой роли не 


играет. 
1бет 115% сго$$ $Ёгис : злемент списка переходов 
5утьо1 [69 0 ; входной символ. при котором автомат 
: переходит в состояние ниже 
: (поля 14 $Таёе_сго$$ и пехё_1фет) 
14 зтафе_сго5$ 4 0 ; идентификатор целевого состояния 
; В списке состояний 
ро1пе_5фафе да 0 : адрес элемента целевого состояния 
пехЕ_1{ет 9 0 : адрес следующего элемента в списке 
: переходов для этого состояния 
еп45 


: Макрокоманда: сгеафе_11ет_сго5$. Создание элемента списка переходов | 
:1 для определенного состояния. 
|| вход: ЕВХ — адрес предыдущего (для поля Чезсг.пех®_1%ет). | 
я Для первого должен быть равен нулю. | 
$1 — символ АЗСТТ. при поступлении которого производится переход | 

в состояние °ае. | 
дезсг — имя структуры-элемента списка переходов. 
°Тафе -— номер состояния, в которое производится переход. 

(если двузначное. то в скобках <>). 
| Пеаа — имя переменной для указателя на конец списка состояний. | 
=] Напа Неа — дескриптор кучи процесса по умолчанию. | 
еее 

выход: ЕВХ — адрес созданного элемента списка переходов. 
СЕ = 1 - ошибка: нет такого состояния. 





Ри 1$ет_сго$$ тасго $1т:КЕО. тате:ВЕО. дезсг:ВЕ(. Пеад:КЕЦ. Напд_Неад:КЕО 
1оса1 т1. @@сус1. ехлЕ т 
+----- сохраняем регистры 
ризИ еах 
а запрашиваем и инициализируем блок памяти из кучи 
(РУОТО НеарАТТос(НАЮОЕЕ ИНеар. ОМОВО дмЕТад$. ОмОВО диВусез) 


ри$Н Туре дезсг : размер структуры 
рии 0 ; флаги не задаем 
ри$И Напд_Неад ; описатель кучи 
са11 НеарА1Тос 
МОУ Геах] .пехё_1$ет. ебх :адрес предыдущего 
ЮУ еБх. еах : запоминаем адрес текущего 
тоу [еах] .зутбо1. “&51т" ; инициализируем поле 5утфо] 
: текущего элемента 
оу [еах].149 $(аёе сго$$. зфафе : номер состояния в дезсг 


фЕЗЕЕ теперь нужно определить адрес элемента в списке состояний 
: 5фате для выполнения дальнейших переходов и инициализации 
; поля ро1пё {асе 


ризВ еБх 
ЮУ ебх. Пеад 
С1с 
@@суст: стр [ебх].14 $Тафе_5Фате. збафе 
3е м] 


3с ех1 м 
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том ебх. [ебх].ргем_тафе : адрес предыдущего состояния 
: в списке состояний 
те5т ебх. ебх : последний элемент? 
32 @@сус1 
5 
тр @@сус] 
;----- нашли! 
т: ОУ [еах) .ротиё_табе, еБх 
ЕВЕ восстанавливаем регистры 
ех1 м: рор еБх 
рор еах 


епат 
Далее приведена вспомогательная макрокоманда, которая по номеру состоя- 
ния определяет адрес соответствующего элемента в списке состояний 


| Макрокоманда: деГ ро1пе_1{ет $Та(е. 
;| Определение элемента в Списке состояний по номеру состояния. 


;| Вход: № $бафе - номер состояния. | 
: Неа — имя ячейки. где хранится указатель на список состояний. 1 


ЧеР ропЕ чет эвм птасго №_5тайе:КЕЦ. Неаб:ВЕО 
1Тоса\  @@су. @@т1 


ЮУ еах. пеа4 
@@су: стр [еах].14 зтате бабе. № фаге 
3е @@т1 ; нашли? 
ЮУ еах. [еах].ргеу_%аёе : адрес следующего состояния 
Тез еах. еах ; последний элемент? 
зая @@су 
56с ; (Е=1. если состояния с таким номером 
: не существует 
Зтр @@су 
фа=зая нашли! 
@ 61: пор 


Собственно программа ргд02_11.азт, выполняющая построение и инициализа- 
цию конечного автомата для распознавания лексемы вещественного числа в ди- 
рективах 94, 94 и &, достаточно велика. Полный ее текст можно найти среди фай- 
лов, прилагаемых к книге, 


Дерево 


То, что неясно, следует выяснить. То, что трудно 
творить, следует делать с великой настойчивостью. 


Конфуций 
Деревом называется сетевая структура, обладающая следующими свойствами: 


* среди всех узлов существует один, у которого отсутствуют ребра, приходящие 
от других узлов, — этот узел называется корнем; 


® все узлы, за исключением корня, имеют одно и только одно входящее ребро; 
Я ко всем узлам дерева имеется путь, начало которого находится в корне дерева. 


Графически дерево изображают так, как показано на рис. 2.18 (как выразился 
классик криптографии Брюс Шнайер, «в компьютерных лесах деревья растут 
сверху вниз»). 
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) @®ы № 
э № ® ® а 
на сына1 


сыновей 





Р — указатель „------------------_ 
на вершину 
дерева 


Рис. 2.18. Изображение дерева и соответствующего ему связного списка 


Следуя терминологии дерева, можно ввести некоторые определения, касающи- 
еся его структуры. Путем из узла и, в узел и, называется последовательность узлов 
п, п, ..,П» где для всех $ 1 = {= В узел п, является родителем узла и, ‚.Длиной пути 
называется число, наединицу меньшее числа узлов, составляющих этот путь. Око- 
нечные узлы дерева, которые не ссылаются на другие узлы, называются листьями. 
Другие узлы дерева, за исключением корня, называются узлами ветвления. Две 
смежные вершины дерева состоят в «родственных» отношениях. Вершина Х, на- 
ходящаяся на более высоком уровне дерева по отношению к вершине У, называет- 
ся отцом. Соответственно, вершина У по отношению к Х называется сыном. Если 
вершина Х имеет несколько сыновей, то по отношению друг к другу последние 
называются братьями. В принципе, вместо этих терминов можно использовать 
следующие: родитель, потомок, предок и т. п. Классификация деревьев произво- 
дится по степени исхода ветвей из узлов деревьев. Дерево называется т-арным, 
если степень исхода его узлов не превышает значения т. 

В практических приложениях широко используется специальный класс дере- 
вьев — бинарные деревья. Бинарное дерево — т-арное дерево при 77 = 2. Это озна- 
чает, что степень исхода его вершин не превышает 2. В случае когда 71 равно 0 или 
2, имеет место полное бинарное дерево. Важно то, что любое т-арное дерево мож- 
но преобразовать в эквивалентное ему бинарное дерево. В свою очередь, в силу 
ограничений по степени исхода вершин бинарное дерево легче представлять в па- 
мяти и обрабатывать. По этой причине мы основное внимание уделим работе с би- 
нарными деревьями. 

Перечислим операции, которые обычно выполняются при работе с деревьями: 


’ представление дерева в памяти; 

® обход или прохождение дерева (поиск в дереве); 

" включение в дерево и исключение из дерева определенного узла; 
* балансировка дерева и операции со сбалансированным деревом. 
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Представление дерева в памяти 


Естественным является представление дерева в памяти компьютера в форме мно- 
госвязного списка. Это наиболее динамичная форма. В случае постоянства струк- 
туры дерева могут использоваться и другие способы представления дерева в памя- 
ти, например в виде массива, как это было во время рассмотрения нами двоичной 
сортировки. В случае представления дерева в форме многосвязного списка указа- 
тель на начало списка должен указывать на элемент списка, являющийся корнем. 
В свою очередь, узлы дерева связываются между собой так, чтобы корень дерева 
был связан с корнями его поддеревьев и т. д. При этом можно выделить три случая. 


Связь узлов в дереве осуществляется таким образом (рис. 2.19, <), что каждый 
узел-сын содержит ссылку на вышестоящий узел (узел-отец). В этом случае 
корень будет содержать нулевой указатель на месте соответствующего указате- 
ля. Имея такой тип связей узлов в дереве, можно подниматься от нижних уров- 
ней дерева к его корню, что бывает полезным при реализации определенных 
видов синтаксического разбора. 

Каждый узел дерева содержит указатели на свои поддеревья (рис. 2.19, 6), то 
есть каждый отец ссылается на своих сыновей. Этот способ применим для пред- 
ставления деревьев небольшой «арности», например бинарных деревьев. Имея 
указатель на корень дерева, можно достичь любого узла дерева. 

Каждый узел дерева ссылается на свои поддеревья с помощью списка, при этом 
каждый узел содержит два указателя — для представления списка поддеревьев 
и для связывания узлов в этот список (рис. 2.19, в). 


а б в 
Рис. 2.19. Варианты связи узлов дерева между собой 


Бинарное дерево обычно представляется с помощью второго способа (рис. 2.19, 6). 
Минимально для представления узла достаточно трех полей: содержательной час- 
ти узла и двух указателей — на левого (старшего) и правого (младшего) сыновей. 
Таким образом, описать бинарное двоичное дерево можно с помощью нелинейно- 
го двусвязного списка. Структура узла в программе может выглядеть так: 


поде_Егее 5ёгис 

$утьо1 а 0 : содержательная часть 

]_$0п [* 0 : указатель на старшего (левого) сына 
го [46 0 : указатель на младшего (правого) сына 
еп05 


Рассмотрим на простом примере реализацию основных операций над деревом. 
Ранее при обсуждении сортировок упоминался двоичный поиск. При этом гово- 
рилось, что сам алгоритм совпадает с алгоритмом прохождения пути от вершины 
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двоичного дерева к заданной его вершине. Реализуем данный вид поиска, но уже 
посредством действительно двоичного дерева. Для начала построим двоичное де- 
рево, используя произвольный массив чисел. 


Построение двоичного дерева 


Как уже отмечалось выше, для реализации двоичного поиска необходим упорядо- 
ченный массив чисел. Поэтому уже на этапе построения двоичное дерево необхо- 
димо специальным образом организовать. Двоичное дерево поиска организуется 
так, что между его узлами существуют следующие соотношения: для каждого узла 
а все элементы левого поддерева меныше а, а элементы правого поддерева больше 
ти равны а. 


п ------- + 
поде_+гее $Егис ; узел дерева 
Зутоо1 [#1 0 ; содержательная часть 
‚ ]_$0п 09 0 : указатель на старшего (левого) сына 
г_ $01 99 0 ; указатель на младшего (правого) сына 
еп4$ 
.даТа 
па$ [1 37. 12. ВИ. 651. 41, 541. 111. Он. Зеп. 5п 
96 4, 871. 7Н. 218. 651. 451. 22и, и. 771. 51 
[е 26н. 7Зн. 351. 121, 498, 371. 528 
1 паз = $ - ма5 
.с0де 


Ви] 9В1иТгее — ргос 

= формируем корень дерева и указатель на дерево НеаЧТгее. 

. Для размещения дерева используем кучу, выделяемую процессу 
по умолчанию (1 Мбайт). но при необходимости можно создать 

: и дополнительную кучу с помощью НеарСгеате 

1------ НАМОЕЕ СбетРгосез$Неар (УОТО) 
са11 бетРгосе$$Неар 
ЮУ Найд Неа. еах : сохраняем дескриптор 

1------ запрашиваем и инициализируем блок памяти 
из кучи для корня дерева’ 
хог еБх. ебх ; будет указатель на предыдущий узел 

1------ (РУОТО НеарАос«(НАМОЕЕ Вы ОМОРО Ф\Г1ад$. ОМОВО д»Вуте$) 
ризН Туре поде {гее ; размер структуры для узла дерева 


ризН 0 ; флаги не задаем 
ризВ еах ; описатель кучи 
са11 НеарАТ ос 
оу НеаОТгее. еах ; запоминаем указатель на корень 
оу ебх. еах ; ив ех 
:------ подчистим выделенную область памяти в куче 
ри$И 95 
рор е5 
оу е01. еах 
оу есх. Туре поде Тгее 
хог а1. а1 
с19 
гер $то$Ь 
]еа е$1. таз ; первое число из таз в корень дерева 
10956 : число в а1 


оу [ебх] .зутбо]. а1 
------ далее в цикле работаем с деревом и массивом таз 
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Ме есх. 1 таз - 1 
14+ --- запрашиваем блок памяти из кучи для узла дерева: 
: "РМОТО НеарАПос(НАМОЕ ВНеар. ОМОКО @мЕ1а9$. ОМОВО дмВуфе$) 
@@сус11: ри$И есх ; НеарАТТос портит есх. возвращая 
: в нем некоторое значение 
ризН Туре поде 1гее ; размер структуры для узла дерева 


рип 0 ; флаги не задаем 
ризВ Напа Неад ; описатель кучи 
са11 НеарАТ1ос 
рор есх 
оу еБх. еах : запоминаем указатель на узел дерева в ебх 
ет №еМ№оде, еах : и во временную переменную 
:------ подчистим выделенную область памяти в куче 
пом е01. еах 
ри$В есх 
Ме есх. Туре поде_1гее 
хог а]. а} 
с14 
гер 50$ 
рор есх 
----= читаем очередное число из таз и записываем его в новый узел 
10456 : число в а1 


оу [еБх].зутбоТ, а1 
у------ ищем место в дереве согласно условиям упорядочивания 
и настраиваем указатели в узлах дерева 


оу ебх. НеадТгее 
м 5еагсп: стр а1. [ебх] .зутбо1 
поу ед1. ебх ; продублируем 
Зае м1 ; если а1 >= [еБх) .зутЬо1 
;------ если меньше. то идем по левой ветке 
Де) ебх. [ебх].}_зоп 
Тез ебх. ебх 
32 тм сеагсй 


------ если этого сына нет. то добавляем его к «папе» 
оу ебх. МемМоде 
моу [е91].1_з0п. ебх 
Зпр еп4 сус11 

1------ если больше или равно. то по правой ветви 


т: оу ебх. [ебх].г_50п 

Те ебх. ебх 

32 т сеагси 

:------ если этого сына нет. то добавляем его к «папе» 

оу ебх. №мМоде 

оу [е01].г_з0й. ебх 
еп сус11: 1оор  @@сус11 

гее : двоичное дерево поиска построено 
Вил 1 аВ1итгее епар 
$Таее ргосе  пеаг : точка входа в программу 


са11 Виз 1АВ1пТгее 
ета ы 
В результате мы должны получить дерево, обойдя которое в определенном по- 


рядке, сформируем упорядоченный массив чисел: 


2и. 41. 48. 51, 76. Ви. 118. 111. 121, 121. 211. 22н. 26и. З2в. 354. 371. 371. 451. 
49н. 51т. 524. 54и. 651. 651. 73Зп. 77И. 871. 


Убедимся в этом, разработав программу обхода двоичного дерева. 
Обход узлов дерева 


Возможны три варианта обхода дерева: 
® сверху вниз — корень, левое поддерево, правое поддерево; 
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* слева направо — левое поддерево, корень, правое поддерево; 
* снизу вверх — левое поддерево, правое поддерево, корень. 


Понятно, что процедура обхода рекурсивна. Под термином «обход дерева» 
понимается то, что в соответствии с одним из определенных выше вариантов посе- 
щается каждый узел дерева и с его содержательной частью выполняются некото- 
рые действия. Для нашей задачи годится только второй вариант, так как только в 
этом случае порядок посещения узлов будет соответствовать упорядоченному мас- 
сиву. В качестве полезной работы будем извлекать значение из узла двоичного 
дерева и выводить его в массив в памяти. Отметим особенности функции [АВеаь 
производящей обход дерева. Во-первых, она рекурсивная, во-вторых, в ней для 
РАНЕНИЯ адресов узлов используется свой собственный стек. 


оное се- + 
поде_фгее $Ёгис ; узел дерева 
зутбо1 96 0 : содержательная часть 
1_$0п [#6] 0 : указатель на старшего (левого) сына 
г $01 [#1 0 : указатель на младшего (правого) сына 
еп4$ 
дезс_$&К $ёгис ; дескриптор программного стека 
епд$ 
не - описание макрокоманд работы со стеком 
------ создание стека 
сгеафе_ к пасго  НапдНеад:ВЕЦ. дезсг:ВЕЦ. 512е5 {К :=<256> 
а я 
НЫ добавление элемента в стек 
ризй_$ К пасго  Чезсг:ВЕЦ. га_1$ет: ЕО 
епат ый 
у------ извлечение элемента из стека 
рор_$1К пасго  Чезсг:ВЕО. гд_Тет: ВЕД 
етот И 
.даба 
паз [6 37н. 121. 8п. 658. 41. 548. 111, 02, З21. 51. 4п 
96 87и. 7п. 211. 651. 45н, 221, В. 778. 511. 268 
Ге] 731. 35и. 121. 491. З7Н. 52и ; исходный массив 
1 паз = $ - паз 
огдегед аггау 4 1 паз дир (0) :; упорядоченный массив 
:; (результат см. в отладчике) 
Чонб1емога_$1к дезс_$1к <> : дескриптор стека 
соий_са11 94 0 : счетчик рекурсивного вызова процедуры 
.соде 
Вил 1 ЧВтиТгее ргос : см. рг9б2_12.а$т 
------ двоичное дерево поиска построено 
гее 
Вил 1 аВ1иТгее епар 
Е ВВеат ргос 


:------ рекурсивная процедура обхода дерева — слева направо 
- (левое поддерево. корень. правое поддерево) 
тс соипе_са11 ; подсчет количества вызовов процедуры 
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: (для согласования количества записей 
; и извпечений из стека) 
Тез+ ебх. ебх 


$2 @@ех1Е_р 
оу ебх. [ебх].1_50п 
Тез ебх. еБх 
Ау. @@т1 
ризи_5ЁК ЧомбТемога_5ТК. ебх 

6611: са11 1 АВеаЕ 
рор_$тК доибЛеМога $%К. ебх 
пс @@тг 

фаеЕЕАЕ подчистим за собой стек и на выход 

оу есх. соипЁ_са11 
дес есх 
рор №е/№ де ; рор "в никуда" 
Тоор $ -6 
тр @@ех1Е_р 

@@т2: оу а1. [ебх] .зутбо1 
с1а 
$Фо$Ь 
оу ебх. [ебх].г_зоп 
фезт ебх, ебх 
$2 @@т1 


ризй_$ЕК доуЛенога ${к. ебх 
са11 1 АВеае 


@вех1т_р: дес соипф_са11 
гее 
| АВеат епар 
Эфаге ргос пеаг : Точка входа в программу 
са11 Вил 1 9В1иТгее ; формируем двоичное дерево поиска 


Ее обходим узлы двоичного дерева слева направо 

и извлекаем значения из содержательной части. 
: нам понадобится свой стек (размер 256 байтов устроит. 
; но макроопределение мы подкорректировали) 

сгеа{е_${к Напа _НеаЧ. ЧоцЬЛемога $1К 


ризп 95 

рор е5 

Теа е41. огдегед_аггау 
[ей ебх. Неа@Тгее 


ризп_$1к домБ1енога $. ебх ; указатель на корень в наш стек 
са11 Е ВВеат 
Еще одно замечание о рекурсивном механизме. Реализация рекурсии в про- 
граммах ассемблера лишена той комфортности, которая характерна для языков 
высокого уровня. В данном варианте реализации для рекурсивной процедуры [Веа{ 
возникает несбалансированность стека. В результате этого после последнего ее 
выполнения на вершине стека лежит не тот адрес и команда КЕТ отрабатывает не- 
верно. Для устранения подобного эффекта нужно вводить корректирующий код, 
суть которого заключается в следующем. Процедура 1КВеа{ подсчитывает количе- 
ство обращений к ней и легальных, то есть через команду ВЕТ, выходов из нее. При 
последнем выполнении анализируется счетчик обращений соип{_саЦ и произво- 
дится корректировка стека. Данный способ подходит не для всех возможных прак- 
тических задач. Поэтому лучшим способом будет аккуратное поддержание стека 
в процессе рекурсивного вызова процедур. Предлагаю читателям самостоятельно 
реализовать этот вариант программы. 
Для полноты изложения осталось только показать, как изменится процедура 
| ВВеа{ для других вариантов обхода дерева. Варианты обеих операций, ЦОВеае и 
К1ВеаЕ, можно найти среди файлов, прилагаемых к книге. 
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Построенное выше бинарное дерево теперь можно использовать для дальней- 
ших операций, в частности поиска. Для достижения максимальной эффективно- 
сти поиска необходимо, чтобы дерево было сбалансированным. Так, дерево считается 
идеально сбалансированным, если число вершин в его левых и правых поддеревь- 
ях отличается не более чем на единицу. Более подробные сведения о сбалансиро- 
ванных деревьях вы можете получить, изучая соответствующую литературу [4]. 
Здесь же будем считать, что сбалансированное дерево уже построено. Разберемся 
с тем, как производить включение и исключение узлов в подобном, заранее по- 
строенном упорядоченном дереве. 


Включение узла в упорядоченное 
бинарное дерево 


Задача включения узла в дерево уже была решена нами при построении дерева. 
Осталось оформить соответствующий фрагмент программы в виде отдельной про- 
цедуры а4Модегее. Чтобы не дублировать код, разработаем рекурсивный вариант 
процедуры включения — а44МодеТеее. Он хоть и не так нагляден, как нерекурсив- 
ный вариант кода в программе ргд_03.азт, но выглядит достаточно профессиональ- 
но. Текст процедуры ад4№детее вы найдете среди файлов, прилагаемых к книге. 

Работу процедуры а@4МодеТгее можно проверить с помощью программы 
ргд02_13.азт (в файлах, сопровождающих книгу, ей соответствует программа 
рг902_14.а$т). 

В результате проведенных работ мы получили дублирование кода, строящего 
и дополняющего дерево. В принципе, для этого достаточно одной процедуры 
а@4МодеТгее. Но в учебных целях мы ничего изменять не будем, чтобы иметь два 
варианта построения дерева — рекурсивный и нерекурсивный. При необходимо- 
сти читатель сам определит, какой из вариантов более всего отвечает его задаче, 
и в соответствии с ней доработает код. 


Исключение узла из упорядоченного 
бинарного дерева 


Эта процедура более сложная. Причиной тому то обстоятельство, что существует 
несколько вариантов расположения исключаемого узла в дереве: узел представля- 
ет собой лист, узел имеет одного потомка и узел имеет двух потомков. Самый не- 
простой случай — последний. Процедура удаления элемента де\МодеТее является 
рекурсивной и, более того, содержит вложенную процедуру @4е(, которая также яв- 
ляется рекурсивной. Текст процедуры 4еМодеТеее находится среди файлов, прила- 
гаемых к книге. 

Работу этой процедуры можно проверить с помощью программы ргд02_13.-азт 
{вкомплекте файлов, прилагаемых к книге, ей соответствует программа ргд02_15.азт). 

Графически процесс исключения из дерева выглядит так, как показано на 
рис. 2.20. Исключаемый узел помечен стрелкой. 

Для многих прикладных задач, ориентированных на обработку символьной 
информации, важное значение могут иметь так называемые лексикографические 
деревья. Для нашего изложения они важны тем, что находят эффективное приме- 
нение при разработке трансляторов, чему мы также уделим внимание в этой книге. 
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Рис. 2.20. Исключение из дерева 


Лексикографическое дерево 


Деревья поиска, подобные лексикографическим, являются альтернативой мето- 
дам поиска, основанным на хэшировании. Структурно лексикографическое дере- 
во представляет собой бинарное дерево поиска. Рассмотрим задачу, которая за- 
ключается в анализе некоторого текстового файла и сборе статистики о частоте 
встречаемости слов в этом тексте. В качестве итога требуется вывести на экран 
информацию о частоте повторяемости каждого слова. В такой постановке задачи 
программа будет состоять из следующих частей. 


Чтение текстового файла и построение соответствующего ему лексикографи- 
ческого дерева. Для этого будем читать и проверять на предмет новизны каж- 
дое слово в анализируемом тексте. Если слово встретилось впервые, то необхо- 
димо сформировать и внести в дерево узел, который структурно состоит из двух 
полей: поля для хранения самого слова и поля для хранения частоты встречае- 
мости этого слова в тексте. 


Для вывода на экран статистики требуется совершить левосторонний обход 
дерева. Если изменить условия вывода статистики, например упорядочить сло- 
ва по частоте повторяемости в тексте, то необходимо выполнить перестройку 
дерева и его последующий правосторонний обход. 


Для простоты преобразования положим, что каждое слово может встречаться 
в тексте не более 9 раз. Длина слова — не более 10 символов (для упрощения кон- 
троль количества вводимых символов не производится). Слова в файле разделя- 
ются одним пробелом. Также для сокращения текста программы считаем, что имя 
входного файла фиксированно — 11 е.6. 

Программа построения лексикографического дерева ргд_12_78.а5т имеет дос- 
таточно большой размер, полный ее текст можно найти среди файлов, прилагае- 
мых к книге. 
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Бинарные деревья — неединственный вид деревьев, которые могут быть исполь- 
зованы в ваших программах. В литературе [2, 4, 13] можно ознакомиться с пред- 
ставлениями деревьев, отличных от бинарных. Мы не будем развивать далее про- 
блему представления деревьев, хотя, честно говоря, очень хочется. За кадром 
остались такие важные проблемы, как балансировка деревьев, работа с В-деревья- 
ми ит. д. После столь обстоятельного введения и при наличии соответствующей 
литературы вы сможете без особого труда решить эти и другие проблемы. Тем бо- 
лее, что на худой конец любое дерево поддается преобразованию в бинарное и ра- 
боте с ним при помощи приемов, описанных в настоящем разделе. 

В преддверии рассмотрения следующего материала отметим, что разработан- 
ная в этом разделе программа будет очень полезна в процессе построения различ- 
ных транслирующих программ, частным случаем которых являются компилято- 
ры. Лексикографические деревья можно с успехом использовать в процессе работы 
сканера, задачей которого, в частности, является выяснение принадлежности не- 
которого идентификатора к ключевым словам некоторого языка. Введите в файл 
ие список ключевых слов (разделенных одним пробелом), запустите програм- 
му и в памяти вы получите лексикографическое дерево. 


Глава 3 


Процедуры в программах 
на ассемблере 


Если бы строители строили здания так же, как про- 
граммисты пишут программы, первый залетевший дя- 
тел разрушил бы цивилизацию. 


Второй закон Вейнберга (Прикладная Мерфология) 


В учебнике достаточно полно был рассмотрен вопрос организации работы с про- 
цедурами, но некоторые проблемы остались за кадром. В этой главе мы остано- 
вимся на трех из них: реализации рекурсивных и вложенных процедур на ассемб- 
лере, а также разработке динамических библиотек (01.1.). 


Реализация рекурсивных процедур 


Впредыдущей главе, посвященной структурам данных, использовались рекурсив- 
ные процедуры. Данный вопрос требует дополнительного пояснения. 

Процедура называется рекурсивной, если она прямо или косвенно обращается 
к себе самой. Рекурсия является естественным свойством для большого числа 
математических и вычислительных алгоритмов. Важно отметить, что любой ре- 
курсивный алгоритм можно сделать итеративным, но это не всегда целесообразно. 
Втеории программирования рекурсия, как правило, воспринималась неоднозначно. 
В конечном итоге была выработана следующая рекомендация — рекурсию следу- 
ет избегать в случаях, когда имеется очевидное итерационное решение. Как мы 
убедимся из приведенного ниже обсуждения, очевидная рекурсивная задача вы- 
числения факториала не дает никакого выигрыша относительно другой программ- 
ной реализации. Настоящий эффект возникает в тех задачах, где рекурсия исполь- 
зована в определении обрабатываемых данных. Такими данными могут являться, 
например, динамические структуры данных — стеки, деревья, списки, очереди и т. п. 

Как показал материал, посвященный структурам данных, это действительно 
верно. При небольшом усилии в программе на ассемблере можно достаточно 
эффективно организовать рекурсивную процедуру, подобную процедуре обхода 
дерева {ВВеаё из главы 2. 
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В ассемблере нет средств прямой поддержки рекурсивных алгоритмов, но есть 
косвенные — нужно только немного подыграть этому процессу. По сравнению 
с языками высокого уровня, имеющими встроенную поддержку рекурсии, в про- 
грамме ассемблера все действия по ее организации приходится предусматривать 
самому программисту. А для этого необходимо иметь представление о процессах, 
происходящих при рекурсивном вызове процедуры. 

Планируя использование рекурсивных процедур, необходимо продумывать 
следующие вопросы: 


способы передачи параметров в процедуру и возврата результатов ее работы; 
способ сохранения локальных переменных процедуры; 
организацию выхода из процедуры. 


Подробно эти вопросы обсуждались в главе 15 «Модульное программирова- 
ние» учебника. Но при организации рекурсии они приобретают особый смысл, так 
как требуется не просто вызвать процедуру, а вызвать ее из себя несколько раз, 
обрабатывая при каждом вызове свои локальные данные, и в конечном итоге воз- 
вратить управление в точку программы, расположенную следом за первым вызо- 
вом данной процедуры. 

Как правило, для работы с локальными данными процедуры и параметрами, 
передаваемыми в процедуру, задействуется стек. При этом не обязательно исполь- 
зовать для этого только системный стек, иногда удобнее создать его модель, рабо- 
ту с которой осуществлять средствами самой программы. Пример организации 
такого программного стека мы реализовали при написании программы обхода де- 
рева посредством рекурсивной процедуры ЕВВег. 

Рассмотрим характерные моменты рекурсивного вызова процедур на примере 
классической задачи по теме — вычисления факториала. Вспомним алгоритм вы- 
числения факториала: 

ЕО) = 1; Е2)=Гх ЕС - 1) 

Как было отмечено выше, с точки зрения скорости работы кода рекурсивный 


вариант вычисления факториала неэффективен, его лучше вычислять итеративно 
в цикле, но в учебных целях этот пример оправдан. 
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оу г_Тасф,1 
ризп — мога р&г 5 


са11 Тасе 


В общем-то ничего необычного в этом коде нет. Передача параметров в рекур- 
сивную процедуру производится через стек. При этом в него необязательно поме- 
щать все данные. Возможен вариант, когда локальные данные определяют в сег- 
менте данных или в выделенной динамической области памяти, а в стек помещается 
только указатель на них. В любом случае, начало рекурсивной процедуры будет 
содержать код пролога, подобный приведенному в программе выше: 


Расе ргос 
ризИ Бр 
ет Бр. $р 


Смысл этого фрагмента легче понять, наблюдая поведение программы вычис- 
ления факториала в отладчике. Как было сказано, перед вызовом процедуры в стек 
помещаются данные (или указатель на них), информация о местонахождении ко- 
торых должна быть сохранена в интересах как вызывающей, так и вызываемой 
процедуры. В нашем случае в процедуру ТасЕ передается переменная факториала. 
После этого производится вызов процедуры, в результате чего в стек заносится 
адрес возврата. В вызванной процедуре к данным переменным необходимо полу- 
чить доступ. Для этого предназначен регистр ЕВР/ВР. Перед использованием его 
содержимое должно быть также сохранено в стеке. Для первого вызова его значе- 
ние несущественно. В этот момент весь предыдущий контекст работы программы 
сохранен. Команда то\у Бр, $р загружает в регистр ВР указатель на текущую верши- 
ну стека, после чего можно обращаться к данным, переданным в процедуру. По 
сути, сейчас мы с вами сформировали кадр стека. Следующий рекурсивный вы- 
зов этой функции придает действию сохранения регистра ВР особый смысл. 
Команда ризН Бр сохраняет в стеке адрес кадра стека для предыдущего вызова ре- 
курсивной процедуры. Теперь для выхода из процедуры достаточно выполнить 
приведенные ниже команды эпилога, позволяющие корректно отработать обрат- 
ную цепочку возврата в основную программу: 


еп р: пом. р. Бр 
рор р 
ге 

ТасЕ епар 


Проследите в отладчике за тем, как происходит удаление кадров стека из про- 
цедуры и возврат в программу на первую после инициирующей рекурсивный вы- 
зов команды САЦ. команду. 

Если вам не нравится обращаться к параметрам в кадре стека посредством ре- 
гистра ЕВР/ВР, то вы можете использовать средства ТАЗМ для более удобной орга- 
низации этого процесса. Они подробно описаны в главе 15 «Модульное программи- 
рование» учебника. Но суть применения этих средств та же, в чем легко убедиться 
с помощью глашатая истины — отладчика. 

С параметрами все ясно, но как быть с локальными переменными, с которыми 
работает рекурсивно вызываемая функция? Для их размещения необходимо пла- 
нировать место в стеке и предусматривать код, который помещает локальные пе- 
ременные в стек, а затем восстанавливает их. Для примера рассмотрим программу, 
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которая рисует узор на основе окружностей. В основе этого графического постро- 
ения лежит алгоритм [45], суть которого показывают приведенные ниже фрагмен- 
ты текста процедуры на псевдоязыке: 


// ОгамРаЕтеги — рекурсивная процедура ОгамРа егп (вариант 1) 
// вывода на экран узора из окружностей на псевдоязыке (фрагмент) 
// Вход: хиу - координаты центра окружности: г - радиус окружности: 
// р - порядок узора. Вмпа — идентификатор окна. НОС — идентификатор контекста 
УОТО ОгамраЕЕеги ( 
НЫМО Випд,НОС Вас. ТМТ | ОВО х. №Т_ОМОВО у.1МТ_ОМОВО г.ТМТ_ОМОЕО р) 

ПЕРЕМЕННЫЕ 
НУМО Имп; НОС пас; 
ТМТ_ОмОвО пас. х. у. г.р 
НАЧ ПРОГ 

ЕСЛИ (р) ТО //пока р*0 

НАЧ БЛОК_1 
// Е111рзе — функция 132 АРТ для вывода эллипса (окружности). вписанного 
// в прямоугольник (квадрат) с координатами правого верхнего угла (х_ир. у ир) 
/! и левого нижнего угла (х_Том. у _10м): 
// ЕТ 1рзе 
// (НОС пас. ТМТ_ОМЮВО х ир. 1МТ_ОМОВО у_ир. 1МТ _ОмОКО х_1ом. ТМТ_ОМОВО у_Лом) 
// так как для рисования нужны координаты прямоугольника, 
/[ а не центра окружности, то преобразуем их при вызове Е111рзе: 
Е111рзе(Вас. х_ир-г. у ир-г. х_1ом+г. у_10и+г) 
// рисуем еще четыре окружности с центрами по краям этой окружности 
ОгамраСеги (Вита. Нас, х-г. у. г. р-1) 
ОгамРаЕегп (Импа. Пас. х. у-г. г. р-П) 
ОгамРафеги (Купа. Пас. х+г. у, г, р-1) 
ОгамраЕеги (Вмпд. Пас. х. у+г. г. р-1) 

КОН _БЛОК_1 
КОН_ПРОГ 


Вызов данной процедуры из программы на псевдоязыке может быть следую- 
щим: 


Др 

// рисовать узор 5-го порядка 
ОгамРаЕЕегп (Кмпд, Пас. 200. 140. 60. 5) 
И 


Для того чтобы избежать рассмотрения лишних деталей, эта функция интегри- 
рована в среду оконного приложения ргд_17_1 из главы 17 «Архитектура и прог- 
раммирование сопроцессора» учебника. Поэтому детали реализации оконного 
М/тдо\з-приложения вы можете посмотреть там. Сейчас же сосредоточим все 
внимание на рекурсивной функции ОгамРа ег. Эту функцию мы реализовали 
в двух вариантах — без использования локальных переменных (ОгамРаегп_1) ис 
использованием локальных переменных (ОгамРаНет_2). Тексты обеих функций 
мы поместили в ОГ.1.-библиотеку таКеЕ_аЦ.0И. Работа с О.-библиотеками будет 
рассмотрена в этой главе ниже. Далее сравним работу функций ОгамРаМегп_1 
и ОгауРа(егп_1. 

Вызов функции ОгамРаИет_1 из основной программы осуществляется следую- 
щим фрагментом кода (полный текст имеется среди материалов, прилагаемых к 
книге, в каталоге программ для данной главы). 


- Программа: ргд3_1.азт. Фрагмент оконного приложения. ] 
:| вызывающего рекурсивную процедуру ОгамРаеги_1. ] 


1------ объявление пользовательских процедур (из маКеЁ_ 911.04.) 
ехёгп ОгамРатеги_1:РКОС 


Реализация рекурсивных процедур 153 


ехёгп ОгаиРафтеги_2:РКОС 

Чаба 

ЕЕ определение констант для фигуры “Узор из окружностей“ 

р да 5 : порядок узора 
г 99 60 :; радиус окружности 
УР да 140 ; начальная у-координата центра окружности 
хР 99 200 : начальная х-координата центра окружности 
соде 
еее тен нненне-- + 

:| Процедура: МепиРгос. Обработка сообщений от меню. | 

а ОЕ КОБ НЫ Е + 
ее ргос 
агд @@Нила:ОИОКО. @@ирагат:ОМОВО. @@пас:Омоко. @@НЬгиз : ООО 
и5е5 еах. ебх 


ОУ ебх. @@ирагат —: в Бх идентификатор меню 


стр Ьх. ТОМ БЕЕ ВАСЕЗ_1 
3е @@1ататТТасез_1 
стр Ьх. ПОМ 04. _ГАСЕЗ_2 
3е @@т9то1ТТасез_2 
тр @@ехле 


ветато11асез_1: ^ 


с ееенЕ рисуем узор из окружностей. рекурсивная функция для рисования 
: находится в ОМ -модуле: 

Огамратеги_1(Импа. Пас. х. у. г. р) - 

функция не работает с локальными переменными 


ризИ р ; порядок узора 

ри$й г : радиус окружности 

ри$Н УР : У-координата центра окружности 
ризв ХР : Х-координата центра окружности 
ризй  метас : идентификатор контекста устройства 
ри$й @Обпила 

са11 ОгамРаеги_1 

Эр (@вех{ 


Фрагмент файла маКеё 91.0, содержащий процедуру ОгаиРаНет_1, приведен 
ниже: 


= Библиотека: макее 911.04. ] 
| Фрагмент 0М.. содержащей рекурсивную процедуру ОгаиРаЕегп_1. | 


:------ обьявление процедур ОЫ.-библиотеки общедоступными 


риуБ11са1 1 иглфеСоп 

руб11с911 ОгамРаегп_1 

руб11с911 Огамра{теги_2 

.соде 
анна - + 


| Процедура: ОгамРаегп_1. Рекурсивная процедура рисования узора 
:| (без использования локальных переменных). 


араьега 1 ргос 
агд @ОГьта:Омога. @@Нас:Омога. @@х:Омюга. @@у:диога. @@г:0мога. @@р:диога 
:------ рисуем окружность 
: рекурсивно вызываем ОгамРа{$егп 1(Иьпа.Нас.х.у.г.р> 
ВОО. ЕТ11рзе (НОС Нас. тпё пьеРЕВесь. 1пе пТорВесё. 1пё пРаанЕВесе 
17% пВобфтомКест): 
готовим параметры в стеке для вызова Е111рзе 


са11 Е111рзе : рисуем окружность 
------ и еще четыре меньшего порядка 
дес @@р 
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стр @@р, 0 
3е @@Епа Огам 
УНг @6г. 1 : делим на 2 


; готовим параметры в стеке 
; для вызова ОгамРа{кеги_1 
са11 Огамраегп_1 


: готовим параметры в стеке 
; для вызова ОгамРасвеги_1 
са11 ОгамРа{егп_1 


Реаннех (х.у-г) 

ана : готовим параметры в стеке 
: для вызова ОгамРасееги_1 

са11 ОгамРаегп_1 
ЕН (х.у+г) 

Ра : готовим параметры в стеке 
: Аля вызова ОгамРаеги_1 

са11 Огамраеги_1 

Е генерация сообщения ИМ_РАТМТ 

: для вывода изображения на экран 
@@Епа_Огам: 


са пуа1 1датекесе 
ге 
епар ОгамРафегп_1 


Такой вариант процедуры не требует внимания к параметрам, которые переда- 
ются в стеке при вызове рекурсивной процедуры, так как после возврата из нее 
они попросту не нужны и удаляются из стека. Но стоит нам в процедуре ОгамуРаегп 
изменить порядок обращения к процедуре ЕШрзе, как ситуация резко меняется. 
Рассмотрим второй вариант организации процедуры ОгамРаНегт. 


// ОгамРаЕфегп — рекурсивная процедура ОгаиРаЕЕегп (вариант 2) вывода 
// на экран узора из окружностей на псевдоязыке (фрагмент) 
// Вход: хиу - координаты центра окружности: г - радиус окружности: 
// р — порядок узора, Рмпа — идентификатор окна. НОС — идентификатор контекста. 
\УОТО Огамраебегт ( 
НИКО Нипд.НОС вдс.ТМТ_Биово х.ТМТ_ОМОКО у.ТАТ ОиОвО г.ТАТ_ОМОЕО р} 

ПЕРЕМЕННЫЕ 
НИМО Импа; НОС Нас; 
ТАТ_ОмМОКО Нас. х, у. г.р 
НАЧ ПРОГ 

ЕСЛИ (р) ТО // пока р=0 

НАЧ БЛОК_1 
- // рисуем еще четыре окружности с центрами по краям этой 
Огамраееги (Купа. Пас. х-г. у. г. р-П) 
ОгамРаЕеги (Имп@. Нас. х. у-г, г. р-1) 
ОгамраЕегпт (Пипа, Нас. х+г. у. г. р-1) 
ОгамРаегп (Импд. Вас. х, у+г. г. р-1) 
// Е 11рзе — функция №4п32 АРТ для вывода эллипса (окружности). вписанного 
// в прямоугольник (квадрат) с координатами правого верхнего угла (х_ир. у ир) 
// и левого нижнего угла (х_Том. у _10м): 
// Е111рзе( 
// НОС Вас. ТМТ_ВиовО х_ир. ТМТ_ОМОЕО у_ир. ТМТ_ОМОВО х_Том. 1МТ_ОМОВО у Том) 
// так как для рисования нужны координаты прямоугольника. 
/Г а не центра окружности, то преобразуем их при вызове Е11трзе: 
Е 11рзе(вас. х ир-г. у _ир-г. х_10и+г. у_10м+г) 

КОН БЛОК_1 


КОН_ПРОГ 
Если в первом варианте процедуры ОгамРа ег — ОгамРаЦегп_1 окружности ри- 
совались перед очередной рекурсивной передачей управления в процедуру Огам- 
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РаКегп, то во втором варианте это делается в последнюю очередь — во время обрат- 
ного хода по цепочке вызовов процедуры ОгамРаНегт. Это уже требует наличия 
локальных переменных в процедуре и их сохранения на период, пока осуществля- 
ются рекурсивные вызовы процедуры ОгамРаветп. Приведем соответствующие 
фрагменты основной программы и функции ОгамРаЦегт_2 из РЕГ-библиотеки 
таке @Ц.О. 


:| Программа: рг93_1.азт. Фрагмент оконного приложения. | 
-| вызывающего рекурсивную процедуру ОгамРаегп_2. ] 


еее + 
| Процедура: МепиРгос. Обработка сообщений от меню. | 
О а ры а ао а Е еее + 
Е ргос 
агд (@@пипа:ОМОВО, @@ирагат: ОМОКО. @@пас:Биоко. @@ибгизН : БиоКО 
45е5 еах. ебх 
ОУ ебх. @@ирагам —:; в Бх идентификатор меню 


стр Ьх. ОМ ЕЕ ГАСЕЗ_1 
де @@19та11Тасез_1 

стр Бх. ТОМ ГЕ 1АСЕЗ 2 
де @@1ат ТЗасез_2 
ЗИр @@ехлЕ 


1------ рисуем узор из окружностей. рекурсивная функция для рисования 
: находится в 01 -библиотеке: 
ОгаиРатеги_2(пипд.Пас.х.у.г.р) — 
функция работает с локальными переменными 
везло Тасез 2: 
; Аля начала очистим окно 
= теперь можно рисовать: ОгаираКегп _2(пипа.Пас.х.у.г.р) 


ризИ р ; порядок узора 

рии г : радиус окружности 

рип у_Р : у-координата центра окружности 
ри$В хР : х-координата центра окружности 
ризИ метас : идентификатор контекста устройства 
ризв @ОИипа 


са11 ОгамРавЕеги_2 
;-----+ генерация сообщения ИМ РАМТ для вывода изображения на экран 


са11 — 1имаТлдафевесь 
тр @@ех1е 


: Библиотека: таке 911.04. Фрагмент ОН -библиотеки. | 
| содержащей рекурсивную процедуру ОгамРаЕеги_2. | 


В а а а Е Е р ыы + 
вы + 
:| Процедура: ОгамраЕегп_2. Рекурсивная процедура рисования узора | 
| (С использованием локальных переменных). | 
ый + 
Огаираегп _2  ргос 
агд @ОрРила: бога. @@ПдсС: дога. @@х:дмога. @@у: нога, @@г:мога. @@р:амога 


------ рисуем окружность - 
: рекурсивно вызываем ОгамРаЕТегп_2(Рмпд.Нас.х.у.г.р) 
дес @@р 
стр @@р.0 
3е @@Епа_Огам 
$Иг @@г. 1 : делим на 2 
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ВЕВЕЕЕ готовим параметры в стеке для вызова Е111рзе 


ЕЕ вызываем Огаира{Ееги для отображения еще четырех 
. окружностей меньшего порядка 
ЕЕ (х-г.у) 
а ; готовим параметры в стеке 
: для вызова ОгамРатеги_2 
са11 ОгаиРа еги_2 
ЕР (х+г.у) 
а : готовим параметры в стеке 
: для вызова ОгамРа{беги_2 
са11 ОгамРафеги_2 


ыы (х.у-г) 
а : готовим параметры в стеке 
: для вызова ОгамРаеги_2 
са11 ОгаиРатеги_2 
Вене (х.у+г) 
В : готовим параметры в стеке 
: для вызова ОгамРасеги_2 
са11 Огаираеги_2 
зе рисуем окружности на обратном ходе, для чего организуем 
: доступ в стеке к локальным параметрам для Е111рзе 
@@Епа_Огам: рии ебр 
оу ебр. [е$р] 
ри$В Чога рёг [ебр-4] 
ризИ Чмога рёг Гебр-81 
ризй  Фога рёг Гебр-12] 
ризН Фога рЕг Гебр-16] 
ри$Н Чиога рёг [ефр-20} 


са11 Е111рзе : рисуем окружность 
рор ебр 
ге 

епар Огамра{Теги_2 


Из этого фрагмента отчетливо видно, в чем разница между размещением пара- 
метров, передаваемых в рекурсивную процедуру, и локалыгыми переменными этой 
процедуры. Для доступа к параметрам используются положительные смещения 
относительно адреса в ВР (это скрыто от нас с помощью директивы АЕб), а для 
доступа к локальным параметрам — отрицательные смещения. 

Разница в изображениях возникла из-за разных мест в программе, где вызыва- 
ется функция ТпуайдайеКесе. Попробуйте самостоятельно исправить этот «дефект». 


Разработка динамических библиотек (О0М.) 


Библиотеки динамической компоновки (Пупапис Глок Г4Ьгачез, ОГ1.$) представля- 
ют собой хранилище общедоступных процедур. Механизм ОЦ.-библиотек явля- 
ется неотъемлемой частью операционной системы \/ш4о\уз. Суть этого механиз- 
ма в том, что в процессе компоновки исполняемого модуля с использованием 
внешних процедур в него помещаются не сами процедуры, а только их названия 
(номера) вместе с названиями ОГТ.-библиотек, в которых они содержатся. В главе 15 
«Модульное программирование» учебника для связи модулей на разных языках 
рассматривались стандартные соглашения по передаче параметров, которые спе- 
цифическим образом реализовывались на уровне конкретных компиляторов язы- 
ков программирования. Этот аппарат был, пожалуй, единственным средством связи 
разноязыковых модулей при программировании для М$ РО5. В среде \/Лт4о\5 
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более естественным является механизм ОТ.Т.-модулей. Он позволяет, в частности, 
разработать набор процедур на ассемблере и затем использовать их в программах 
на языках высокого уровня, поддерживающих механизм динамического (поздне- 
го) связывания. 

Как правило, если язык программирования поддерживает разработку МЛт4о\5- 
приложений, то он имеет средства для разработки и использования РГ .-библио- 
тек. Ассемблер не является исключением. Общие принципы О1Т.Г.-библиотек для 
всех языков одинаковы, так как эти библиотеки являются универсальным сред- 
ством, не зависящим от конкретного языка. Поэтому, разрабатывая ОГ.-модуль, 
необходимо учитывать общие требования ктаким библиотекам. Структурно ОГ1.- 
библиотека представляет собой обычную программу, включающую некоторые спе- 
цифические элементы. Рассмотрим процесс создания и использования О[.-биб- 
лиотеки на языке ассемблера. Для этого разработаем консольное приложение, 
которое выводит некоторую строку на экран 10 раз. На каждой итерации вывода 
меняются атрибуты этой строки. За основу взята программа ргд05_11.азт из гла- 
вы 5. Только теперь строка с выводимым сообщением находится в приложении, 
асама процедура вывода — внутри 01... Для демонстрации передачи и возврата 
параметров в процедуру передаются длина и адрес строки, а возвращаются значе- 
ния ОНННИЮ в четырех регистрах — ЕАХ, ЕВХ, ЕСХ, ЕБХ. Обсудим процесс по шагам. 


Шаг 1. Разработка текста ОМ--библиотеки 


Как мы уже отметили, ОГТ.-библиотека представляет собой обычную программу 
на языке ассемблера. Выбор примера поэтому неслучаен. Тем самым мы подтвер- 
дим тезис о том, что обычная программа и ОГ.Т.-библиотека имеют много общего. 
С точки зрения структуры, О -библиотека является набором процедур, перемен- 
ных и констант, а также необязательного кода инициализации, которые оформле- 
ны в соответствии с требованиями ассемблера. Ниже приведен пример ОГ Т.-биб- 
лиотеки для нашей задачи. 


: Модуль: такее_0911.азт. Текст ОМ. -библиотеки. 


:| Содержит одну функцию — Иг1еСоп. 
4 - + 





„люде] Пае. $ТОСАЦЕ ; модель памяти ЕТаф 
;------ Объявление внешними используемых в данной программе 
: функций И?п32 (АЗСТТ) 


------ объявление процедуры Иг1еСоп общедоступной 


риб11с911 ИгтбеСоп 
„дафа т: 
.соде 
011Мат" ргос 
агд @ОНТо5Е:0июга. @@еуепЕ:Омога. @@по_ие: дога 
@@т: тмоу еах. 1 
ге 
071Матп епар 
ИгтбеСоп ргос : см. материалы. прилагаемые к книге. 


: и рг905_11.а5т из главы 5 
агд @бадг_5{г:@мога, @@1еп_5{г:@мога 
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ге’ 

еп4р ИгтбеСоп 
епа 011Матп 

Хорошо видно, что текст для ОГ.-библиотеки является действительно обыч- 
ным файлом ассемблера. Есть все, даже имя точки входа, указываемое в последней 
директиве ЕМ№О. Но здесь и начинаются странности. На самом деле это не обычная 
точка входа, которую мы привыкли указывать в любой программе на ассемблере, 
а адрес команды в О -библиотеке, получающей управление в строго определен- 
ных случаях. Эта команда является первой в цепочке команд, составляющих так 
называемый код инициализации ОТ.Т-библиотеки. Назначение этого кода — выпол- 
нить необходимые действия по инициализации О.-библиотеки при наступле- 
нии определенных событий. Его наличие необязательно, и при его отсутствии нет 
необходимости указывать соответствующую метку в заключительной директиве 
ЕМО. Если все же код инициализации присутствует в ОГГ.-библиотеке, то он дол- 
жен быть разработан с учетом определенных требований. 


Во-первых, этот код должен быть рассчитан на то, что он получает управление 
в одном из четырех случаев. О наступлении каждого из этих случаев операци- 
онная система извещает О.-библиотеку путем передачи ей одного из четырех 
предопределенных значений — флагов. Значения этих флагов перечислены 
в файле ммппЕ.В. Рассмотрим данные флаги и возможные действия при их по- 
ступлении в О.-библиотеку. 


О ОЦ_ РКОСЕ$$_АТТАСН = 1 — передается операционной системой ОГ.Т.-библио- 
теке при проецировании последней в адресное пространство процесса. Пе- 
редача этого флага производится всего один раз, обычно при загрузке при- 
ложения, использующего данную ОГ].-библиотеку. Если позже другой 
процесс попытается загрузить ту же библиотеку, то система попросту уве- 
личит ее счетчик использования без посылки флага ОН. _РКОСЕ$$ _АТТАСН. 
Получив данный флаг, ОГ.-библиотека должна выполнить действия по со- 
зданию необходимой среды функционирования для своих процедур. Напри- 
мер, обеспечить их кучей. 


О ОН ТНЕЕАО_АТТАСН = 2 — передается операционной системой ОЫ.-библио- 
теке при создании нового потока в процессе. Этим библиотеке предоставля- 
ется возможность нужным образом обработать факт создания нового пото- 
ка. Следует иметь в виду, что описываемое действие не является обратимым, 
то есть если ОГ].-библиотека загружается в процесс, когда в нем уже функ- 
ционируют потоки, то ни одному из них не посылается флаг ОН._ТНВЕАВ_ 
АТТАСН. 


о 0Ц ТНВЕАО_ОЕТАСН = 3 — передается операционной системой ОГЛ.-библио- 
теке при выгрузке потоком О. -библиотеки. 


О ОЕ РВОСЕ$$_ОЕТАСН = 0 — передается операционной системой О1.Т.-библио- 
теке при выгрузке ОГТ.-библиотеки из адресного пространства процесса. 
Логично, что при этом требуется провести завершающие действия по осво- 
бождению всех ресурсов, которыми владеет ОТ.Т.-библиотека. Обычно эти 
действия являются обратными по отношению к предпринятым при инициа- 
лизации библиотеки (см. флаг 0И._РКОСЕ$$_АТТАСН). 
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# Во-вторых, имя точки входа О .-библиотеки может быть любым, но уникаль- 
ным в пределах одной ОТ.1.. Главное, чтобы при наличии кода инициализации 
это имя было указано в директиве ЕМ№О. 

м В-третьих, оформление кода инициализации в виде отдельной процедуры не- 
обязательно. Главное, выполнить два основных действия кода инициализации 
ОЫ.-библиотеки (при его наличии): 

С вернуть единицу в регистре ЕАХ; 

О удалить из стека три параметра, которые передаются ОГ.Т.-библиотеке при 
передаче описанных выше флагов: У/л$Е0М. — дескриптор ОТ.Г.-библиотеки, 
назначенный ей системой при загрузке библиотеки в адресное пространство 
процесса; еуепё — значение флага, передаваемого в ОТ.Ё-библиотеку; 
Итр\оа@ — параметр не равен 0, если библиотека загружена неявно (см. ни- 
же), и равен 0 в противном случае. 


Структура полного варианта кода инициализации выглядит так: 


1псТиде ит пбоиСопА Тис : проверьте значения флагов в этом файле 
011Мати ргос 
агд НТА$ЕБЫ. : фиог@, — еуепё: ога. Е трЕоад: диюга 

стр [еуетё 1. О: _РКОСЕ$$ АТТАСН 

Зпе м 


ЕЕ. выполняем действия для ОЕ _РЕОСЕ$$ АТТАСН 


стр [емепёТ. 0. ТНАЕАО АТТАСН 
Зпе Ш 
ЕЕ выполняем действия для ОЕ ТНКЕАО_АТТАСН 


стр [ее]. ОМ. ТНВЕАО ОЕТАСН 
Зте п 
не выполняем действия для 0ЕЁ ТНКЕАО ОЕТАСН 


стр [еуепё]. ОМ. _РВОСЕ$ ОЕТАСН 
3Зпе [Ш 
ааа выполняем действия для ОМ. _РЕОСЕЗ$ ОЕТАСН 


т: ОУ . еах, 1 
ге 
011Мази епдр 
Минимальный вариант может выглядеть так, как это сделано в нашем примере: 
01 ]Малп ргос 
агд ВТт$Е0Щ. : диогд. — емепё:дмога, ЕтрЕоад: дога 
т: ОУ еах, 1 
ге 
011Ма1п епар 
Или так; 
011Мазт: 
м: ОУ еах, 1 
геё 12 


Не забывайте, что директива АКб приводит к тому, что в код, генерируемый 
транслятором, вставляются команды ЕМТЕК и ЕЕАУЕО (см. выше раздел «Реализа- 
ция рекурсивных процедур» и раздел «Реализация вложенных процедур» среди 
материалов, выложенных на сайт). Кроме этого, команда ВЕТ процедуры дополняет- 
ся значением, равным сумме длин параметров, указанных в директиве АКС. Исполне- 
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ние такой команды приводит к удалению из стека количества байтов, равного этому 
сформированному значению. Что касается кода функций (процедур), составляющих 
ОН.-библиотеку, то для их написания используются стандартные правила разработ- 
ки программ. Описание данных также ничем не отличается от обычной программы 
ассемблера. Ведь в конечном итоге код и данные процедур ОГ.-библиотеки оказы- 
ваются в адресном пространстве процесса наравне с его кодом и данными. 

Последнее, что необходимо отметить, — все экземпляры данных и имена про- 
цедур, которые должны быть видны вне пределов ОГ..-библиотеки, объявляются 
общими при помощи одной из директив — РУВЫС или РУВИСОМ.. 


Шаг 2. Трансляция и компоновка 
исходного текста ОЦ.--библиотеки 


После того как подготовлен исходный текст библиотеки, его транслируют обыч- 
ным для программ ассемблера образом. Что же касается компоновки, то необходи- 
мо помнить, что ее целью является получение файла с расширением ОГТ., а необыч- 
ного файла с расширением ЕХЕ. Весь этот процесс удобно обсуждать на примере 
реального файла таКеЩе, текст которого приведен ниже: 


МАМЕ = такеё 911 
085 = $(МАМЕ) .06] 
ОЕ = $ (МАМЕ) . де? 
КЕЗ = $(МАМЕ) .гез 
ТАЗМОРТ=/тЗ /тх /2 /а /ОМТММЕК=0400 /0_и1№32_ИТММТ=0400 
ТЕ ЗА(ФЕВИВ) 
ТАЗМОЕВУСб=/ 21 
ЕИАКОЕВУб=/у : 
!е15е 
ТАЗМОЕВУб=/1 
ЫИАКОЕВУб= 
епт 
НР $А(МАКЕОТВ) 
ТМРОВТ=1трогЕ32 
!е15е 
ТМРОЕТ=1трогЕ 32 
еп { 
$(МАМЕ).ЕХЕ: $(0805) $(БЕР) 
1тКЗ2 /Тра /аа /с $(Е1АКОЕВУВ) $(08.5).$(МАМЕ).. $(1МРОВТ). $(БЕР) 
.а5т.о5]: 
фазт32 $(ТАЗМОЕВИС) $(ТАЗМОРТ) $&.ат 


Запуск данного файла производится командной строкой: 
таке -ОБЕВИСб —Гтаке#(е_а{. так >р. Е 


В результате формируются несколько файлов, перечень которых определяется 
тем, насколько успешно отработали программы транслятора {азт32 и компонов- 
щика {@пК32. Для быстрой оценки этого результата мы перенаправили весь вывод 
в файл р. Просмотрев этот файл, можно оценить успешность создания ОТ.[- 
библиотеки, не анализируя другие файлы (например, листинг). При наличии син- 
таксических ошибок необходимо исправить их и повторить запуск МАКЕ-файла 
на исполнение. 

Для успешной компоновки необходим еще один файл — с расширением ОЕЕ. 
Необходимое и достаточное содержимое файла такей_9(.4еЁ приведено ниже: 
ИВВАВУ макее_ 911 
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ОЕЗСАРУЮМ —‘и1п32 ОМ ' 
ЕХРОКТ$ ИгтСеСоп @1 


В этом файле следует обратить внимание на макропеременную ЕХРОКТ6, кото- 
рая содержит имена экспортируемых функций ОГ.-библиотеки и их ординалы, 
то есть порядковые номера этих функций в ОЦ.-библиотеке. Последние исполь- 
зовались в 16-разрядных версиях УЛп4о\5, в современных версиях этой операци- 
онной системы их использование необязательно, и Месгозой настоятельно реко- 
мендует этого не делать. 

О том, что компоновщик должен создать именно ОГЛ.-библиотеку, объявляют 
с помощью ключа /Тра. 


Шаг 3. Создание МВ-файла 


Как указать приложению местонахождение внешних функций, расположенных 
в О[.-библиотеках? Если бы приложение работало только с одной ОГ .-библио- 
текой, то проблем бы не было — указывай нужную и продолжай процесс сборки 
приложения. Если количество необходимых приложению О1Т.Т-библиотек боль- 
ше одной, а тем более если их десятки, то ситуация требует иного решения, нежели 
чем простое перечисление нужных приложению ОГТ.-библиотек. Для централи- 
зованного хранения информации о размещении используемых приложением фун- 
кций в ОТТ.-библиотеках применяют []В-файлы. Эти файлы представляют собой 
своеобразный справочник о размещении функций в ОГ.-библиотеках. При этом 
не указывается никаких путей, так как при обращении к ОГТ-библиотеке опера- 
ционная система ищет ее по следующему алгоритму. 


В каталоге, содержащем ЕХЕ-файл приложения. 
В текущем каталоге процесса. 

В системном каталоге \шп4о\5. 

В основном каталоге \/шо\у. 


о Ра 


В каталогах, указанных в переменной окружения РАТН. 


В пакете ТАЗМ для создания 1] В-файла предназначена утилита 1трИБ.ехе. Для 
создания []В-файла в нашем примере необходимо выполнить следующую команд- 
ную строку: 

1МРИВ.ЕХЕ таКеё_@.1Ь таке_@Ц.ОМ. >р.& 

Как видите, мы опять используем перенаправление вывода в файл р. для 
быстрой оценки результата работы программы 1МРИВ.ЕХЕ. Если выполнение этой 
утилиты было успешным, то формируется файл таКеё_аЦ.ПЬ, который в дальней- 
шем используется для сборки целевого приложения. 


Шаг 4. Сборка приложения с использованием 
ОЦ-библиотеки 


Приведем содержимое МАКЕ-файла для сборки целевого приложения: 


МАМЕ = таке 
08.5 = $(МАМЕ) .053 
ОЕЕ = $ (МАМЕ) . Че? 
1+ ФА(ОЕВИВ) 
ТАЗМОЕВУб=/ 21 
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ЕЛАКОЕВУб=/\ 
!е15е 
ТАЗМОЕВУб= 
ИМКОЕВУб= 
1епа1Е 
пы /2 [9 # /ОМЮМЕР=0400 /0_МТ№З2_МТММТ=0400 
тх 
ИТ ЗА(МАКЕОТВ) 
ЕАО СЕ 911 
!е15е 
ТМРОВТ=1трог(З2+такее_411 
!епа1Р 
$(МАМЕ).ЕХЕ: $(089$) $([ЕР) 
ыы /Тре /аа /х /с $(11МКОЕВИС) $(0805).$(МАМЕ).. $(1МРОВТ). $(0ЕЕ) 
.азт. 06: | 
Че! $(МАМЕ).ЕХЕ 
{азт32 $(ТАЗМОЕВИЕ) /т] $(ТАЗМОРТ) $&.азм... 


Теперь, имея два МАКЕ-файла (для сборки файлов .ОТГГ.и.ЕХЕ), можно про- 
вести сравнительный анализ их содержимого. Отметим два момента: 

" вмакропеременной 1МРОКТ указываются имена (без расширений) ТВ-фай- 
лов, содержащих сведения о нужных приложению функциях в ОТ.Т.-биб- 
лиотеках (если ГЛВ-файлов несколько, то они перечисляются с использо- 
ванием знака +); 

& для сборки ЕХЕ-приложения используется ключ /Тре редактора связей. 


Содержимое РЕЕ-файла таКе+{.4е? приложения: 


МАМЕ такее 

ОЕЗСАТРТТОМ 'АззетЬЛу Сопзо1е ИЧпдом$ Ргодгат” 
С00Е РВЕГОАО МОУЕАВЕЕ ОТЗСАВОАВЕЕ 
ОАТА РВЕГОАО МОМЕАВЕЕ МИСТТРЕЕ 
ЕХРОВТ$ 


И наконец, содержимое самого файла таКе{.азт, использующего функцию из 
т нами ОГТ-библиотеки таке @Н.&Ц,. 


— 

тисТидет1Ь макеё 911.116 ; необязательно 

„Чата 

И етехе [919 "Строка выводится процедурой из О." 
Геп_ТИТеТехе = $ - ТИЛеТеж 

.соде 

Зфагё ргос пеаг : точка входа в программу 


ризп  1еп Т\ЛеТеже 
ризН оРРбее Т1ТетТехЕ 
са п ИглвеСоп 
ех1{: : выход из приложения 


в из ОИ.-библиотеки функцию необходимо объявить внешней 
с помощью директивы ехётп М/пеСоп:РКОС, 


Шаг 5. Проверка работоспособности приложения 
с использованием ОН--библиотеки 


Для проверки работоспособности полученного на предыдущем шаге приложения 
хорошо подходит отладчик 1432.ехе. Кстати, когда вы будете в нем работать, обра- 
тите внимание на то, как происходит переход из ОИ. -библиотеки на код в про- 
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цедуре. Вы увидите, что помощь в этом оказывает «неизвестно откуда» появивша- 
яся команда ЭМР. Причину этого вы можете выяснить, прочитав раздел «Секция 
описания импортируемых функций РЕ-файла» главы «Форматы исполняемых 
файлов» книги [40]. 

При разработке ОТ.Т.-библиотек естественным образом возникает вопрос о со- 
вместимости с приложениями, написанными на других языках. Это тем более ак- 
туально, если речь идет о продуктах разных фирм-производителей программного 
обеспечения. Проверить, насколько совместима сформированная нами с помощью 
средств ТАЗМ ОГТ-библиотека, можно с помощью утилиты ВИМРВУМ.ЕХЕ из паке- 
та Мгсгозой У1виа| З6и 10. Запустите ее командной строкой вида: 


ООМРВТМ.ЕХЕ —ехрог$ таКеЕ_@Ц.0М.>р.х+ 


Тогда в файле р ХЕ вы получите отчет о содержимом раздела экспорта ОГ 
библиотеки таКеЕ_@Ц.4Ц. Проанализировав полученные результаты, вы убедитесь, 
что проблем с распознаванием нашей ОТ.Т.-библиотеки у этого программного сред- 
ства фирмы М!сгозой не возникло. Это дает основание полагать, что данную библи- 
отеку при соответствующем наполнении полезными функциями можно использо- 
вать при программировании на \15иа!С/С++, У1зиа!Вазгс и т. п. При этом необходи- 
мо иметь в виду, что есть вероятность искажения имен функций при использовании 
компиляторов различных фирм. Подробнее об этом можно узнать в соответствую- 
щей литературе [11]. 

Не следует забывать, что на практике допустимы три формы загрузки ОШ-- 
библиотеки в адресное пространство процесса: неявная, явная и отложенная. Опи- 
санный выше способ сборки приложения на самом деле был неявным и предпола- 
гал, что загрузка ОГТ.-библиотеки производится при запуске самого приложения. 
Явный способ загрузки ОТТ.-библиотеки предполагает ее загрузку во время рабо- 
ты приложения. Для этого в \/ 132 АР] существуют специальные функции: 


НЮТАМСЕ ГоадЕ19Ьгагу( |РСТЗТВ ТрЕТЬЕ11еМате ): 
НМОБИЕ — 1оа@1ЬгагуЕх(ЕРСТЗТВ ЛрелЬЕ1ТеМате. НАКОЕЕ ВЕ11Те. ОмОкО 9мЕ1а9$): 


Третий способ подключения ОГТ.-библиотек — отложенная загрузка. Этот спо- 
соб предполагает, что ОГТ-библиотека не будет загружена в адресное простран- 
ство процесса до тех пор, пока приложению не потребуется осуществить доступ 
к любому экспортируемому из данной ОП-библиотеки объекту (переменной, кон- 
станте, процедуре). Подробнее об этом и других вопросах разработки и использо- 
вания ОГТ-библиотек можно прочитать в литературе [11]. 


Глава 4 


Обработка цепочек 
элементов 


Против незнания есть только одно средство — 
знание. Истинное же знание может быть достигнуто 
только через личное соверщенствование. 


Л. Н. Толстой 


Представленный ниже материал является дополнением к главе 12 «Цепочечные 
команды» учебника. Из этой главы следуют выводы о том, что, во-первых, цепо- 
чечные команды являются мощным инструментом обработки последовательно- 
стей элементов размером 1/2/4 байтов и, во-вторых, это единственное средство 
процессора для обработки данных по схеме память-память. В процессе разработ- 
ки программ для учебника и этой книги мы достаточно часто использовали коман- 
ды процессора этой группы. Но цепочечные команды — это примитивы, и, как 
любые примитивы, они являются лишь основой для построения более сложных 
алгоритмов обработки цепочек элементов. Особенно это чувствуется при разра- 
ботке программ для задач обработки текстов и, в частности, задачи поиска. Для 
решения озвученной проблемы существует ряд классических алгоритмов, опти- 
мизирующих этот процесс. Ниже будет приведено несколько программ, демонст- 
рирующих алгоритмы поиска данных в строках символов, то есть цепочках эле- 
ментов размером 1 байт. Так как всеони построены на основе стандартных байтовых 
цепочечных команд процессора, то при необходимости обработки последователь- 
ностей элементов большей размерности (2 и 4 байта) их доработка не составит 
вам особого труда. 

Организацию поиска одиночного символа в программе на ассемблере мы рас- 
сматривать не будем, так как это делается самими цепочечными командами без 
привлечения посторонней алгоритмической поддержки. Информацию об этом 
можно получить из учебника. 

Более подробно мы разберем организацию поиска текстовой подстроки в стро- 
ке символов, превышающей размер искомой подстроки. При всей кажущейся про- 
стоте этого вида поиска его реализация в программах на языке ассемблера сопря- 
жена с рядом проблем. 





Прямой поиск в текстовой строке 165 


Введем некоторые обозначения: 

Р— строка-аргумент поиска, размерность строки Р — М байтов, ] — индекс сим- 

вола в строке Р, 0 << М- 1; 

5 — строка, в которой ведется поиск строки Р, размерность строки 5 — №байтов, 

? — индекс символа в строке 5, 0 <1< №М- 1. 

Все алгоритмы поиска в текстовой строке можно разбить на два класса: прямые 
и учитывающие особенности объектов поиска. Последний класс алгоритмов пред- 
полагает предварительный анализ искомой подстроки и формирование на его ос- 
нове некоторой информации, управляющей процессом поиска. 


Прямой поиск в текстовой строке 


Цель поиска некоторой строки Р в строке большего размера 5 — определить пер- 
вый индекс элемента в строке 5, начиная с которого все символы 5 совпадают 
с символами строки Р. Для этого алгоритм поиска последовательно просматрива- 
ет символы строки 5, проводя одновременное сравнение ее очередного символа 
с первым символом строки Р. После возникновения такого совпадения алгоритм 
производит последовательное сравнение соответствующих элементов строк 5 иР 
до возникновения одного из следующих условий: 

в процессе поиска соответствия достигнут конец строки Р— это означает, что 

строка Р совпадает с некоторой подстрокой строки .5; 

достигнут конец строки 5 при незавершенном или не начатом просмотре стро- 

ки Р- это означает, что строке Р не соответствует ни одна из подстрок 5. 

Одна из главных проблем, которую приходится решать при написании програм- 
мы обработки символьной строки, — определение конца строки 5. Здесь возмож- 
ны два варианта: 

статический — размер строки фиксирован некоторым значением М; 

динамический (характерен для обработки массивов символьных строк) — дли- 

на строки определяется значением, являющимся либо первым элементом оче- 

редной строки, либо концевым (служебным) символом, значение которого за- 

ранее определено и не может совпадать ни с одним символом строки. 

Начнем обсуждение прямого способа поиска с программы поиска в строке 
с фиксированной длиной. Для экономии места ограничим число вхождений Рв 5 
единицей. 


мы 

$ [91°] "Ах. какой был яркий день!" 
(61°) “ Лодка. солнце. блеск и тень." 
[9 “ и везде цвела сирень.” ; задаем массив 5 
еп $ =$-$ 


[в]. "$" 
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тез {ео "Вхождений строки — " 
р [65] “ень” ; задаем массив Р — аргумент поиска 
еп Р =$-р 
06 ке 
Соипё 0 (72$ ; счетчик вхождений Рв 5 
.соде 
с1а 
[1 сх. 1еп $ 
Теа 91. $ 
оу а1. р ; Р[0]->а1 
пехЕ_зеагсй: Теа $1. р 
тис $1 : на следующий символ 
герпе — зсазЬ 
Эсх2 ех1е 
ризВ сх 
[у сх. 1Тепр - 1 
гере стрзЬ 
32 ед $иб$ег : строка р <> подстроке в $ 
Ще Ьх. 1епр - 1 
$5 Ьх. сх 
рор сх 
$иБ сх. Бх : учли пройденное при сравнении стр$Ь 
тр пехе_зеагсн 


------ далее можно выйти, если поиск однократный. 
| но мы упорные. поэтому продолжаем... 
е9_зи6 г: рор сх 


$иБ сх. 1епр - 1 : учли пройденное при сравнении стрзЬ 
тис соиме 
Эр пех _еагси 

ех1ё: ада соипё. ЗоН 


;------ вывод сообщения тез на экран 


Из программы видно, что когда размер строки фиксирован, то проблема ее кон- 
ца решается просто. Но чаще приходится иметь дело с задачами, выполняющими 
поиск подстроки в строке, длина которой заранее не известна. Это характерно, в ча- 
стности, для приложений обработки файлов. Но и с файлами не так все просто. 
Для текстовых АЗСП-файлов особых проблем нет — в них строки заканчиваются 
символами ОбН, бан. Сложнее дело обстоит с обработкой двоичных файлов, где 
с равной степенью вероятности могут встретиться любые символы кодовой табли- 
цы. В подобных случаях проблему локализации места в файле, где осуществляет- 
ся поиск, нужно решать исходя из постановки конкретной задачи. Несмотря на 
это сами приемы поиска не сильно отличаются от рассмотренных в этом разделе. 

В случае когда поиск осуществляется в строке или в массиве строк в памяти, 
длина которых заранее не известна, то для обозначения их окончаний нужно ввес- 
ти некоторый служебный символ. Например, в ряде языков существует понятие 
строки АЗСПЯ, представляющей собой обычную символьную строку с завершаю- 
щим нулевым символом. По этому символу и определяется конец строки. Подоб- 
ные служебные символы можно использовать и для обработки строк в памяти. 
Другая возможность задания границы строки — введение в структуру строки специ- 
ального поля, обычно первого байта (2 байтов), содержащего длину этой строки. 

Следующая программа демонстрирует возможную организацию поиска в тек- 
стовом файле. Для этого содержимое файла читается в динамически выделяемую 
область памяти. После небольшой модернизации данную программу можно рас- 
сматривать как основу для других программ поиска в строках памяти, ограничен- 
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ных некоторым служебным символом, как это обсуждалось выше. Программа про- 
изводит поиск слова «шалтай» в строках файла. На экран выводится номер стро- 
ки, в которой встретилось это слово, и количество повторений этого слова в файле. 
В такой постановке задачи возникает проблема — необходимо отслеживать на- 
ступление одного из двух событий: обнаружение первого символа образца или об- 
наружение первого из пары символов 0а0ай, обозначающих конец строки. Данную 
задачу можно реализовать двумя способами. Первый заключается в последователь- 
ном чтении и проверке каждого символа строки на предмет удовлетворения их 
одному из обозначенных выше событий. При втором способе каждая строка файла 
сканируется два раза. На первом проходе определяется размер очередной строки, 
а затем эта строка сканируется второй раз на предмет наличия в ней искомой под- 
строки. Достоинство второй схемы состоит в том, что ее можно реализовать толь- 
ко использованием цепочечных команд. Какой из вариантов будет работать быст- 
рее, можно определить с помощью профайлера. Мы выберем второй способ по двум 
причинам: во-первых, в этом разделе нас интересуют варианты использования це- 
почечных команд; во-вторых, в одной программе мы продемонстрируем приемы 
работы со строкой, размер которой определяется динамически двумя способами: 
со служебным символом в конце (им будет ОЧП) и извлекаемым из байта в начале 
строки. В нашей программе байт со значением длины очередной строки будет эму- 
ПИВО ЕВЕ оО 


:| Программа: рг94_67_Ч.азт. Поиск строки Р в массиве строк (файле). 
Длина строк определяется динамически. 


О 
пе$ [9] "Вхождений строки — " 
р [6] "Балта" ; аргумент поиска - слово “Балта“ 
: в файле зпа\{а1.%хё 
1Тепр =$-р 
[4 "-" 
[№ "в строку файла " 
[9 0 : старшая часть преобразования номера строки 
п 5$ ТР Ч 0 : младшая часть преобразования номера строки 
соипе [9 0 : счетчик вхождений Р в 5. от 0 до 9 
; для упрощения алгоритма преобразования 
Геп_Ч1 р = $ - пез 
„зфаск 256. 
соде 
Збаге ргос пеаг ; точка входа в программу 


ЕЕЗНЕЯ для размещения файла используем кучу. выделяемую процессу 

: по умолчанию (1 Мбайт): НАМОЕЕ беерРгосез$Неар (№010); 
са11 беЕРгосезНеар 
ПЮУ Напа Неа. еах ; сохраняем идентификатор 

ЕЕ читаем файл в динамически выделяемую область памяти 

ых открываем файл 

НАМОГЕ Сгеасег11е(ЕРСТЬТВ 1рЕ11еМате. ОмОВО @мОезтгедАссе$$ 
ОМОЕО ФибпагеМоде. ЕРЗЕСИВТТУ АТТЕТВИТЕЗ 

: Тр5есигФуАСЕг1Бибез .ОМОЕО @мСгеаЕ1оп01 роз1Етоп. 

: ОмО8О ОМЕ1адзАпаАСг1Ьие$. НАКМОСЕ ИТетр1афеЕт1е); 


са11 Сгеаее[11еА 
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сус11: 


е ежт: 
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пехЕ_зеагсй: 


стр еах. ОРЕРРЕРЕ 

де ех1{ ; если неуспех 

оу НЕ11Ле. еах : файловый манипулятор 
определим размер файла 

О%ОВО бег11е$12е(НАМОЕЕ ВЕ11е, ЕРОМОВО ТрЕ11е$12еН1оп): 


са11 бесг11е$12е 


Се$% еах. еах 
3: ех{ ; если неуспех 
оу [11е512е. еах : сохраним размер файла 


запрашиваем блок памяти из кучи 
ЕРУОТО НеарАТТос(НАМОЕЕ ПНеар. ОиОКО ОмЕ1адз. ОмОВО дмВубез): 


са11 НеарА11ос 
Ще Биг $Тагё. еах ; адрес блока с текстом программы 
: из общей кучи процесса 
читаем файл 
ВОО КеадЕ11е(НАЮОЕЕ ВЕ1Те. 1РУОТО 1рВи Рег. 
ОМОКО пМитьегОТВусезТоВеаа, 
ЕРОМОЮКО 1рМитЬегОТВуе$Веа4 .ГРОМЕРГАРРЕО 1рб0уегТарред); 


са11  Меаае\Те 
фе$е еах. еах 


Ку. ех1е ; если неуспех 

ризН 9$ 

рор е5 

са 

оу есх. Е11е517е 

ЮУ е01. БиГ $фагЕ ; адрес буфера с текстом файла в ед1 
ризп есх 

ризВ ед 

оу ебх. есх 

оу а1. бан ; ОЧ ->а1 


герпе — зсазЬ 


3х2  еехи 


Эр $+7 

Эр ех1е 

рор ео 

$иБ ебх. есх 

хСП9 ебх. есх 

пом а1. р : Р(0]->а1 

герпе — зсазЬ 

9х2 епд_${г : достигнут конец строки 
проверяем возможное совпадение 

ри$Н есх 

Теа е51. р 

тис е$1 

оу есх. 1епр - 1 

гере стрзЬ 

{2 ед_зиб$ г ; строка р <> подстроке в $ 
оу ейх. Тепр - 1 

$иБ ебх. есх 

рор есх 

$иБ есх. едх : учли пройденное при сравнении стр$Ь 
тр пехё_еагси 

тис еа1 

тис ебх 


ХСН9 ебх. есх 
преобразуем в символьное представление 
счетчик вхождений соипё 


вывод на экран строки тез 


и ен 
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са11 иг беСопзо1еА 


ет соипе. 0 ; обнуляем счетчик вхождений в строку 
рор есх ; восстанавливаем 
тр Сус 

ед $и6$г: рор есх 
ЗБ есх. 1еп_р - 1 ; учли пройденное при сравнении стрзЬ 
Тис [ее ая 
Эр пехЕ_зеагси 

ех": рор есх 


НЫ: выход из программы — задержим взвод до нажатия любой клавиши 


Этой программой мы проиллюстрировали оба варианта поиска с динамическим 
определением размера строки. 

Алгоритмы, реализованные выше, можно использовать для организации поис- 
ка в строке 5 небольшой длины, так как попытки повысить эффективность приве- 
дут к излишним накладным расходам. Для строки 5 большой размерности (пото- 
ковые данные для приложений мультимедиа) прямые алгоритмы поиска могут быть 
неэффективными. Положение можно исправить рассмотренными ниже алгорит- 
мами поиска с предварительным анализом искомой подстроки. 


Поиск с предварительным анализом 
искомой подстроки 


Основу материала этого раздела составляет алгоритм КМП-поиска. Имя «КМП» 
является выборкой первых букв фамилий его создателей: Д. Кнута, Д. Мориса и 
В. Пратта. В основе алгоритма КМП-поиска лежит идея о том, что в процессе про- 
смотра строки 5 с целью поиска вхождения в нее образца Р становится известной 
информация о просмотренной части. Работа алгоритма производится в два этапа. 


1. Анализируется строка-образец Р. По результатам анализа заполняется вспомо- 
гательный массив смещений О. 


2. Производится поиск в строке 5 с использованием строки-образца Ри массива 
смещений О. 


Ниже приведена программа, реализующая алгоритм КМП-поиска. 


// рг94_73_КМР — программа на псевдоязыке поиска строки Р в строке $ 
/!/ по алгоритму КМП-поиска. Длина $ фиксирована. 
/! Вход: $ и Р - массивы символов размером № и М байтов (М=<М). 
/! Выход: сообщение о количестве вхождений строки Р в строку $. 
ПЕРЕМЕННЫЕ 
Т№Т ВУТЕ $[п]; // 0=<1<\-1 
ГМ_ВУТЕ р[м}; // 0=<)<М-1 
ТМТ_ВУТЕ 97}: // массив смещений 
ТМТ_ВУТЕ К=-1; 1=0; 3=0 // индексы 
НАЧ ПРОГ 
//этап 1: формирование массива смещений а 
3:20: к:=-1: 9[0]:=-1 
ПОКА 3<М-1 ДЕЛАТЬ 
НАЧ БЛОК_1 
ПОКА ((К>=0)И(р[3]<>р[К])) К:=а[К] 
3:=3+1: К:=К+1 
ЕСЛИ р[3]==р[К1 ТО 9[33:=а[к} 
ИНАЧЕ 9[3):=К 
КОН_БЛОК_1 
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// этап 2: поиск 
1:=0: }:=0; К:=0 
ПОКА (()<МИ(<м)) ДЕЛАТЬ 
НАЧ БЛОК 1 
ПОКА ((>=0)И($[13<>р()])) :=9[37 
]:=}+1: 1:=14] 
КОН БЛОК_1 
ЕСЛИ 3=М ТО вывод сообщения об удаче поиска 
ИНАЧЕ вывод сообщения о неудаче поиска 
КОН ПРОГ 


:| Программа: рг94_73 КМР.а$т. Поиск строки Р в строке $ | 
| по алгоритму КМП-поиска. Длина 5 фиксирована. | 


еее + 
„Чака 
$ [65 "ТосабетабсааБсадаьс !6дедедед каБабсдабсес" 
[6] 9) “аБеабсдаБсе};котабсаБе” :; задаем массив $ 
1еп_$ =$-$ : №Ееп_5 
[6 "$" 
тез [6 Оан. бай. "Вхождений строки - " 
р [65 "абсдабсе” : задаем массив Р — аргумент поиска 
1епР = $ -р : МЕ еп_Р 
[в] Е 
Соипё [91°] 0:35” : счетчик вхождений Р в $ 
а 0 Геп_р бир (0) —:; массив смещений 
К [#9 0 
соде 
1------ этап 1 — заполнение массива смещений: ]:=0; К:=-1; 9[0):=-1 
хог $1. $1 ; $1 - это 3 
оу К. -1 
поу 4. -1 
------ ПОКА <М-1 ДЕЛАТЬ , 
сус11: стр $1. 1епр-1 : 43-1 
39е ех1т_9 
стр К. 0 : ПОКА ((К>=0)И(р[3]<>р[К])) К:=ЧЁ[К] 
л Та1зее 
оу ы. к 
тоу а1. р[$1] 
стр а1. рЬх] 
Зе Та15ее 
ОУ ы. а[ьх] 
ОУ К. 51 ; К: =] 
тр сус11 
у----- =): К:=К+1 
Га1зее: Ис $1 = 
тис К 
Ще) ыы. К 
ОУ а1. р[$1] : ЕСЛИ р[3]==р[К] ТО 93] :=9Ё[К) 
стр а1. р(Ьх] 
пе е15ее 


поу а1. а[ьх] 
ПЮУ 9[$1]. а1 


тр сус11 ; $+6 
е1 ее: поу 9[$1], [ : ИНАЧЕ 9[)]:=К 
Эпр сус11 
а этап 2: поиск 
ех1(_0: хог 01. 91 0: 
хог $1. $1 : }:=0; 
13: стр $1. Гепр ; ПОКА ((3<МИС1<м)) ДЕЛАТЬ 
33е т 
п34: стр 01. 1еп $ 
3де м] 


стр $1. 0 : ПОКА ((>=0)И($[1<>р[31)) д:=9[3] 
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л пи 

поу ат. $[41] 

стр а1. р[$11 
и 


3е 

поугх а1. 951] 

ое $1. ах 
пм: тис $1 = 

1ис а1 $ 1:=141 

тр пз 
у------ ЕСЛИ ]=М ТО вывод сообщения об удаче поиска 

т]: стр $1. 1епр 

Зпе ех1е_Т ; ИНАЧЕ вывод сообщения о неудаче поиска 

тис соипе 

стр 01. Теп $ 

39е ех1{_Т 

хог $1. $1 

Зтр т34 
ех{_?: ада соипе. 301 


1------ вывод сообщения тез на экран 


Подробно, хотя и не очень удачно, алгоритм КМП-поиска описан у Вирта [4]. 
Этот алгоритм достаточно сложен для понимания, хотя в конечном итоге его идея 
проста. Центральное место в алгоритме КМП-поиска играет вспомогательный мас- 
сив О. Поясним его назначение. Массив О содержит значения, которые нужно до- 
бавить к текущему значению в позиции первого несовпадения символов в строке 
5 и подстроке Р (рис. 4.1). 


1 0123 4567 
арс4 абсе — искомая строка 
4— 1000-1003 


(0006005588500889999999©9960% * с 


УБсдабсе 
+аь сдаьсе 
Бсдабсе 
+002 ь се 
РА =3; 9[3]=0; 1-9[]]=3-0 => сдвиг на 3 позиции [3] 
Ьсдабсе 


+ъ 

@ООчаьсе 
2“ 1= 2; 94[2]= т 9[2]=2-0=2 => сдвиг на 2 позиции [-2-] 
Яо сааьс 


©®‹ асе 
4 =1; 9(1]=0; }-9[1]=1-0=1 => сдвиг на 1 позицию 


6508осо 
ей Ч=7; 9[7]=3; }-9[7]=7-3=4=> 
©8094 5-е сдвиг на 4 позиции 


Ы=3; 9(11=0; ]-9[]]=3-0=3=> 
сдвиг на 3 позиции 
Бсдабсе 


Бсдаьбсе 
Бсдабсе 


@Х5х<@СХ5Ь©(е) — совпадение 


Рис. 4.1. Пример КМП-поиска 


НН 
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Из проведенного обсуждения можно сделать два вывода — один приятный, дру- 
гой — не очень. Во-первых, явное достоинство этого метода в том, что исключены 
возвраты назад. Во-вторых, эффективность использования КМП-поиска зависит 
от исходных данных — реальное ускорение поиска (сдвиг образа Р относительно 
строки 5 более чем на один символ) получается, когда в строке 5 достаточно часто 
встречаются последовательности символов, совпадающие с началом образа Р. 

Следующий (и последний) алгоритм поиска в строке носит название Боуера 
и Мура [4] — БМ-поиск. Он взначительной степени устраняет недостатки, прису- 
щие методу КМП-поиска. 


// ргд4_83 ВР — программа на псевдоязыке поиска строки Р в строке 5 
// по алгоритму БМ-поиска. Длина $ фиксирована. 
// Вход: Зи Р — массивы символов размером № и М байтов (М=<М). 
// Выход: сообщение о количестве вхождений строки Р в строку 5. 
ПЕРЕМЕННЫЕ 
ТМТ_ВУТЕ М: // М- длина образца 
ТМТ_ВУТЕ $1]: // 0=<1<№-1 
Т№Т ВУТЕ р[м]: // 0=<)<М-1 
ГМ ВУТЕ 9256]; —// вспомогательный массив с размером = длине кодовой таблицы 
Т№Т ВУТЕ К=0; 1=0; =0 // индексы 
НАЧ ПРОГ 
// зтап 1: формирование массива Ч 
ДЛЯ 4=0 ДО 255 ДЕЛАТЬ 
НАЧ БЛОК_1 
9[31:=М 
КОН БЛОК 1 
ДЛЯ 3=0 ДО М-2 ДЕЛАТЬ 
НАЧ БЛОК 1 
9[р[)13:=М-5-1 
КОН _БЛОК_1 
// этап 2: поиск 
1:=М 
ПОВТОРИТЬ 
:=М; К:= 
ПОВТОРИТЬ 
К:=К-1; 4:=)-1 
ПОКА (>=0)ИЛИ(р[3]==$[К3) 
1:=1+9[$[1-13] 
ПОКА (3>=0)ИЛИ(1<М) 
ЕСЛИ }<0 ТО вывод сообщения об удаче поиска 
ИНАЧЕ вывод сообщения о неудаче поиска 
КОН ПРОГ 


| Программа: рг94_ВЗ ВР.азт. Поиск строки Р в строке $ 
:] по алгоритму БМ-поиска. Длина $ фиксирована. 


а 

пе$ [6] 9) бан. бай. "Вхокдений строки — " 

р Ч "аб" ; задаем массив Р — аргумент поиска 
еп р =$-р : МЕ ей Р 
[61° "” — в строку —" 

5 [61°] "Тосабсеабсааб” : задаем массив $5 
еп $5 = $ -5 : №(еп_5 
96 - 

Соипе [6] °) 0 ; счетчик вхождений Рв $ 
96 " раз(а)$" 

[в [в 255 @ир (0) ; вспомогательный массив 

К 96 0 

соде 


а этап 1 — заполнение массива 0 значением М — 





СуС11: 


1: 


ех1е_Т: 


ех1ф: 
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размером образца для поиска 


Мом сх. 255 : размер кодовой таблицы АЗСТТ 
моу а1. 1Тепр : ДЛЯ ]=0 ДО 255 ДЕЛАТЬ 

1еа 91.9 

гер $4056 : 9[3]:=М 


цикл просмотра образца и замещение некоторых элементов @ 
значениями смещений (см. пояснение за текстом программы) 
хог $1. $1 ; ]:=0 

ДЛЯ 4-0 ДО М-2 ДЕЛАТЬ 

стр $1. р -1 


33е е сус11` 

ОУ ат. р[$1] 

ом 01. ах 

хог в Ьх 

том . 1епр 

дес ты 

5и6 Бх. $1 

ЮУ 991]. Ы : 9[Р[3]3:=М-3-1 
Тис $1 

пр сус11 

/{этап 2: поиск 

оу 91. 1епр 1:=М 
И — цикл пока (-ФИЛИ(п) 
том 1еп_р 53: м 

Юм ых. 91 

цикл пока (РоимиЦЕ +В 

дес Ьх к-1 
дес $1 : з 91 
стр $1. 0 ; пока (>=0)ИЛИ(р[33==р[К]) 
Л 2 

моу ат. р[$1] 

стр $[6х]. а1 

зле м2 

тр сус13 

1: С -17] 

ри$Н 91 

дес 91 

хог ах.ах 

ЮУ а1. $91] 

Ом Чт. ах 

ОУ а1. 991] 

рор [61 

ада 01. ах $ (=[-9$[1-133 
стр $1. 0 ; цикп пока ()>=()иЛи(1<п) 
л И 

стр 91. 1еп_$ 

39 ех1е ТГ 

Эр сус12 

вывод сообщения о результатах поиска 
тис сои 

тр сус12 

ада соипё. ЗоН 

Теа Чх. тез 

ЮУ ан. 095 


17% 21 


Идея алгоритма БМ-поиска в том, что сравнению подвергаются не первые, а пос- 


ледние символы образца Р и очередного фрагмента строки 5. Если они не равны, 
то сдвиг в строке 5 осуществляется сразу на всю длину образца. Если последние 
символы равны, то сравнению подвергаются предпоследние символы, и т. д. При 
несовпадении очередных символов величина сдвига извлекается из таблицы О, 
которая, таким образом, выполняет ключевую роль в этом алгоритме. Заполнение 
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таблицы происходит на основе конкретной строки-образца Рследующим образом. 
Размер таблицы определяется размером алфавита, то есть количеством кодов сим- 
волов, которые могут появляться в тексте. В нашем случае мы отвели под таблицу 
Л память длиной, равной длине кодовой таблицы АЗСИ. Таким образом, строки 5 
и Рмогут содержать любые символы. Первоначально все байты кодовой таблицы 
заполняются значением, равным длине строки-образца для поиска Р. Далее после- 
довательно извлекаются символы строки-образца Р начиная с первого. Для каж- 
дого символа определяется позиция его самого правого вхождения в строку-обра- 
зец Р. Это значение и заносится в таблицу ДО на место, соответствующее этому 
символу. Подробнее получить представление о заполнении таблицы можно по 
фрагменту программы на псевдоязыке: 


// этап 1: формирование массива а 
ДЛЯ 3=0 ДО 255 ДЕЛАТЬ 

НАЧ БЛОК_1 

9[1]:=М 

КОН_БЛОК 1 
ДЛЯ )=0 ДО М-2 ДЕЛАТЬ 

НАЧ БЛОК 1 

[р[13]:=М-3-1 
КОН БЛОК 1 
Так, для строки абсдаБсе процесс и результаты формирования таблицы Д пока- 


заны на рис. 4.2. 


61 62 63 
М=еп_Р=8 — 61 62 63 аьБьсадег 
аБсдваьсе 0.....37 98 99 100 101 102 
]1=0 12346567 №6 8...3 2140 8 
]= 2 з 4 
в 1 ПП |. 
Га]=7 
[а] = ]=3 ]=5 ]= 
Р[1]=6 р[3]=9 Р[5]=6 рЕ7)=е 
Ч[6]=7-1-1| 9(9]=8-3-1 | 9[6]=8-5—1 |Ч[е]=8-7-1=0 
. }=2 т }-6 
р[2]=с [4] =а Р[6]=с 


@@=8-2-1  Фа]=8-4—1  4[с]=8-6-1 


Рис. 4.2. Формирование массива О в программе БМ-поиска 


Куда в двух последних программах пристроить цепочечные команды? К сожа- 
лению, некуда. Честно говоря, когда автор писал текст этих программ, он настоль- 
ко увлекся, что напрочь забыл как о них, так и о Цели настоящего раздела — пока- 
зать особенности использования цепочечных команд при организации поиска 
информации. А когда вспомнил, то сделал вывод, что пристроить их вродебы и не- 
куда. А вы как думаете? Окончательный вывод об эффективности можно сделать 
по результатам работы профилировщика. 

Развитие этой темы лежит в плоскости обсуждения проблемы обработки фай- 
лов, к которой мы когда-нибудь вернемся. 


Глава 5 


Работа с консолью 
в программах на ассемблере 


Бросая в воду камешки, смотри на круги, ими обра- 
зуемые; иначе бросание будет пустой забавой. 


Козьма Прутков 


На практике редко возникает необходимость разработки программы как «вещи 
в себе». В подавляющем большинстве случаев программа должна взаимодейство- 
вать с пользователем, получая от него данные посредством клавиатуры и выдавая 
результаты своей работы на экран. При знакомстве с новым языком программиро- 
вания одним из первых вопросов, на которые ищет ответа программист, является 
выяснение средств этого языка для выполнения операций обмена с консолью (кон- 
соль — управляющий терминал, клавиатура и монитор). Что касается языка ассем- 
блера, то собственных средств обмена с консолью у него нет. Чтобы выполнить 
подобную операцию, программа использует возможности самого компьютера (пре- 
рывания ВТО$) и операционной системы, в среде которой эта программа работает. 
Каждый программист самостоятельно ищет решение проблемы обмена с консо- 
лью. Так как эта задача актуальна всегда, то имеется необходимость на конкрет- 
ных примерах показать порядок использования средств ВО$ и ОС для обмена 
с консолью в программах на ассемблере. Примеры не очень сложны, и читатель 
легко сможет быстро встроить их в свои программы. 


Функции В1О0$ для работы с консолью 


Вконтексте нашего изложения КОМ ВГТО$ (КВеа4 Ощу Метогу Ваяс при -Оцриё 
Зузет) представляет собой совокупность программ в энергонезависимой памяти 
компьютера, одной из задач которых является устранение специфики аппаратных 
компонентов компьютера для функционирующего на нем программного обеспе- 
чения, включая операционную систему. Обслуживание клавиатуры и монитора 
выполняют программы ВТО$, называемые драйверами. Структурно драйверы со- 
стоят из ряда подпрограмм, называемых функциями, каждая из которых отвечает 
за определенные действия. Обращение к функциям В1О$ производится аналогич- 
но обращению к функциям М$ ОО$5. Для работы с клавиатурой и экраном В1О$ 
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содержит два программных прерывания — 161 и 101, обращение к которым, исхо- 
дя из вышесказанного, является обращением к драйверам этих устройств. Для 
вызова прерываний, как обычно, используется команда 1М№Т — тЕ 161 или 1п% 10[. 
Для выполнения определенной операции в регистр АН заносится номер функции. 
При необходимости в других регистрах может указываться дополнительная (па- 
раметрическая) информация. Ниже рассмотрим подробнее возможности ВГО$ для 
работы с консолью. 


Функции ВО $ для работы с клавиатурой 


Прерывание 16Н ВГО$ имеет функции для различных типов клавиатур: обычной — 
84 клавиши, и двух типов расширенной клавиатуры — 101-—102-и 122-клавишной. 
Выяснить функциональные возможности клавиатуры позволяет функция О9Н: 

Вход; АН = О9Н. 

Выход: АЁ = битовое поле, установленные биты которого обозначают поддер- 
живаемые функции: 7 - резерв; 6 — поддержка клавиатуры со 122 клавишами 
(и функций 208-228 (1+ 161)); 5 — поддержка расширенной клавиатуры со 101— 
102 клавишами (и функций 101—128 (зп 161)); 4 — поддержка функции ОАН (1% 
161); 3 — поддержка функции 03061 (1тЁ 16Н); 2 — поддержка функции 03058 (т 
161); 1 — поддержка функции 03048 (1тЁ 161); 0 — поддержка функции 03001 (тм 
161). 

Прежде чем вызывать эту функцию, необходимо удостовериться в том, что она 
поддерживается данной версией ВТО$. Сделать это можно, вызвав функцию сон 
прерывания 1п% 158. 

Вход: АН = СОН получить конфигурацию. 

Выход: СЕ = 1 — ВОЗ не поддерживает эту функцию; СЕ = 0 — в случае успеха: 
Еб:ВХ — адрес конфигурационной таблицы в КОМ-памяти; АН = состояние (00Н — 
успех; 861 — функция не поддерживается). 

Формат конфигурационной КОМ-таблицы: 


Смещение Размер 


046 1 байт Издание ВТО$: 0 — 1-я редакция, 
1 — 2-я редакция ит. д. 


1-Й байт свойств 
ть 


Если в результате этого вызова бит 6 второго байта свойств установлен, то В1О$ 
поддерживает функцию 09 прерывания 1т% 161, с помощью которой определяют- 
ся функциональные возможности клавиатуры. 
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= Программа: рг905_01.а$т. ] 
|| Определение функциональных возможностей клавиатуры. | 


Е 
мати: 
МОУ ан. осои 
1иё 158 
ризй 95 
ризй е5 
рор 0$ 
поугх ах. Бубе рёг [6х+5] 
ы ах. 6 
рор 95 
эпс ех1е ; функция 09й тп 168 не поддерживается 
; (см. замечание ниже) 
оу ап. 098 : функция О9Н 1пЕ 161 поддерживается 
те 161 : анализируем АБ/АН (см. замечание ниже) 


Относительно использования функций 00 тЁ 15 и О9Н тЕ 16 следует сделать 
следующее замечание. Системы ВТО$ различных производителей реализуют эти 
функции неоднозначно. На компьютере автора с АМ! В!О$ функция ОсСОН 1пё 15 
возвращает нулевой второй байт свойств. Что же касается результатов вызова фун- 
кции О9Н 1тЕ 16, то эта функция возвращает битовое поле не в регистре А! ав АН. 
Поэтому будьте внимательны при использовании этих функций и, если необходи- 
мо, закомментируйте команду пс ехй в приведенном выше фрагменте. 


Чтение символа (Оп, ОН, 201 и 161) 


Вход: АН = 00Н чтение символа с ожиданием (для 84-клавишной клавиатуры). 

Выход: для обычных клавищ (АН = скан-код В1О$; АЁ = символ АЗСП); для 
клавиш и комбинаций с расширенным АЗСП-кодом (АН = расширенный А$СП- 
код; АЁ = 0). 

Функция 00Н 1п 16Н считывает информацию об очередном символе из буфера 
клавиатуры, и если его там нет, то ждет его появления, приостанавливая выполне- 
ние программы. Результат работы функции необходимо оценивать по содержимо- 
му регистра АГ; если АЕ <> 0, то нажата обычная клавиша клавиатуры и регистры 
АЕ и АН содержат соответственно символ АЗСП и скан-код В!О$. В обратном слу- 
чае на клавиатуре была нажата одна из клавиш (или их комбинация), соответству- 
ющая расширенному коду, и регистры А! и АН содержат соответственно нуль и рас- 
ширенный код клавиши. Как известно, любой символ можно внести в буфер, если, 
удерживая нажатой клавишу А\, набирать десятичный код символа на цифровой 
клавиатуре. В этом случае в регистре АН формируется нулевой скан-код, а в ре- 
гистр АЁ заносится введенный код символа А$СИ. 

Для расширенных клавиатур (101-102 и 122 клавиши) необходимо использо- 
вать функции 101 или 20Н 1пЕ 161, так как более ранние функции не поддерживают 
работу с дополнительными клавишами, введенными в состав этих клавиатур. При 
нажатии этих клавиш в регистр АЁ заносится код Ор, а в регистр АН — расширен- 
ный АЗСП-код. 

Вход: АН = 106, 201 чтение символа с ожиданием (для 101-102- и 122-клавиш- 
ных клавиатур соответственно). 
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Выход: для обычных клавиш (АН = скан-код ВОЗ; АЁ = символ А$СП); для 
клавиш и комбинаций с расширенным кодом (АН = расширенный А$СП-код; АЕ = 
= 0); для дополнительных клавиш (АН = расширенный АЗСП-код; АЕ = бен). 

Для ввода строки символов данные функции необходимо использовать в цик- 
ле. На примере показанной ниже программы, запустив отладчик, можно исследо- 
вать содержимое АХ при нажатии различных клавиш и их комбинаций. 


+++ -- + 
:| рг905_02.азт. Ввод строки с использованием функции ввода символа 101. | 
еее + 
„даа 
$119 [в 5 ар (0) 

]Теп_$Ег179 = $ - $199 
адг_$тг1пд да $4г1п9 
.соде 

ОУ сх. 1еп $67179 

1е5 41. а@г_$+г1пд 
м1: оу _ ан. 0108 

9% 160 

$05 


Тоор т 
Программа вводит 5 символов и сохраняет их в строке $. 


Проверка наличия символа (011, 11Нн, 21н т! 16Н) 


Вход: АН = 011 проверка наличия символа (для 84-клавишной клавиатуры). 

Выход: если 2Е = 0, то регистры АН и АЁ содержат: для обычных клавиш (АН = 
= скан-код В1О$; АЕ = символ АЗСП); для клавиш и комбинаций с расширенным 
АЗСП-кодом (АН = расширенный АЗСП-код; А! = 0); если Е = 1, то буфер пуст. 

Функция О1Н получает информацию о символе, не удаляя его из буфера клави- 
атуры. Исключение составляют нажатия дополнительных клавиш на расширен- 
ных моделях, не совместимых с 83—84-клавишными клавиатурами. В процессе про- 
верки функцией 01Н они удаляются из буфера. Поэтому при работе с расширенными 
клавиатурами необходимо использовать функции 11Н и 21Н. 

Вход: АН = 118, 21Н проверка наличия символа (для 101—102- и 122-клавишных 
клавиатур соответственно). 

Выход: если 2 = 0, то регистры АН и АЁ содержат: для обычных клавиш (АН = 
= ВГО$ скан-код; АЁ = символ А$СП); для клавиш и комбинаций с расширенным 
кодом (АН = расширенный АЗСП-код; АЁ —0); для дополнительных клавиш (АН = 
= расширенный АЗСП-код; АЕ = бен); если 2 = 0, то буфер пуст. 

В большинстве случаев работу с результатами выполнения данной функции 
логично начинать с анализа флага 2 (командами 32 или 3№г). Что же касается со- 
держимого регистра АХ, то оно аналогично содержимому этого регистра в рассмот- 
ренной выше функции ООН 1пё 16Н. Совместно с функцией 00Н данную функцию 
можно использовать в программах, управление которыми производится с клавиа- 
туры. Частный случай таких программ — командные процессоры. Соответствую- 
щий фрагмент кода может быть следующим. 


.Оафа 
г [в 10 @р (0) 
абг_$1г да $г 


.соде 


| 
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Те5 91. адг_$г 
хог сх. сх 
------ проверяем наличие символа 
т: оу ап. 018 
17 161 
й ех1ё : буфер пуст 


;------ извлекаем очередной символ 
ЮУ ап. 008 


я 161 
;------ пересылаем его 
56056 


Зтр т 


Получение состояния флагов клавиатуры 
(028, 128, 228 т! 161) 


ВЮ$ предоставляет функцию 021 для получения состояния световых индикато- 
ров клавиатуры и некоторых управляющих клавиш. 

Вход: АН = 021 получить состояние флагов клавиатуры (для 84-клавишной кла- 
виатуры). 

Выход: А = битовое поле, установленные биты которого соответствуют состоя- 
нию следующих флагов: 7 — режим вставки активен; 6 — индикатор Сарз [оск вклю- 
чен; 5 — индикатор Мит 1осК включен; 4 — индикатор $сго| [осК включен; 3 — на- 
жата клавиша АЙ (любая клавиша АЁ на 101-102-клавишной клавиатуре); 2 — 
нажата клавиша С (любая клавиша С на 101-102-клавишной клавиатуре); 
1 — нажата левая клавиша $; 0 — нажата правая клавиша $. 

Поддержка расширенных клавиатур осуществляется функциями 128 и 221 ВТО$. 

Вход: АН = 121, 221 получить состояние флагов клавиатуры (для 101-102- 
и 122-клавишных клавиатур). 

Выход: АЕ = первое битовое поле, установленные биты которого соответствуют 
состоянию флагов, возвращаемых в регистре АЕ функцией 02; АН = второе бито- 
вое поле, установленные биты которого соответствуют следующему состоянию 
флагов: 7 — нажата клавиша РиИпЕ $сгееп (5у$Ва); 6 — нажата клавиша Сарз [осК; 5 — 
нажата клавиша Мит [осК; 4 — нажата клавиша 5стоШосК; 3 — нажата правая клави- 
ша А; 2 — нажата правая клавиша С; 1 — нажата левая клавиша А; 0 — нажата 
левая клавиша СИ. 

Кроме этого, состояние данных флагов можно прочитать из оперативной памя- 
ти по адресам: 00404:0017В (АГ) и 00404:0018В (АН). 


Запись символа в буфер клавиатуры (058 + 161) 
Вход: АН = О5Н запись символа в буфер клавиатуры: СН = скан-код; СЁ = символ 
АЗСП. 

Выход: АЁ = состояние: 00Н — успешная запись; О1Н — ошибка (буфер клавиату- 
ры заполнен). 

С помощью этой функции можно подыгрывать программам, которые ожидают 
ввода с клавиатуры. Сам буфер клавиатуры организован по принципу кольца, имеет 
размер 16 байтов и занимает в памяти диапазон адресов 0040Н:001ЕН...0040Н:0030В. 
В ячейке 0040Н:ООЛАК хранится адрес начала (головы) буфера, а в ячейке 00408: 
001СП — адрес конца (хвоста). Если содержимое этих ячеек равно, то буфер пуст. 
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Одному символу в буфере соответствует слово, в котором первый байт — скан-код 
клавиши, а второй — символ АЗСИП. Исследовать данную функцию можно с ис- 
пользованием конвейерной операции (|) М$ ОО$. Для этого оформим фрагмент 
кода для определения наличия символа в буфере и его ввода в виде отдельной про- 


граммы. 
еее -н----------- + 
:| Программа: рг905_03_02.азт. Проверка наличия символа в буфере. | 
п 4 + 
соде 
Е проверяем наличие символа 

м1: ЮУ ап .018 

пе 161 

Е ех1 : буфер пуст 


;------ извлекаем символ 
оу ан. 008 
Ця 161 
;------ выводим его средствами М5 00$ (см. ниже) 
ЮУ 91. а 
ЮУ ав. 021 
16 21 
тр 1 


Также подготовим программу, помещающую символы из строки $ в буфер 


клавиатуры. 
ен + 
:| рг905_03_01.азт — программа. помещающая символы в буфер клавиатуры. | 
а ----------- + 
„даа 
5ёг [6] "АРВ", 0 
соае 
Теа @1. г 
хог сх, сх 
1: оу ан. 058 
в С1. Буёе рёг [91] 
сх ех1Е 
Ця 168 
Тис 91 
Эр ЩИ 
Е а 


В командную строку М$ ОО$ необходимо ввести строку: 
ргод_1.ехе | ргод_2.ехе >р.Е 


В результате всех этих действий создается файл р. который и будет содер- 
жать строку $ из файла ргод_1.а$т. 


Функции В!О$ для работы с экраном 


Работа с экраном средствами ВТО$ производится с помощью набора функций пре- 
рывания 108. С помощью этих функций поддерживаются текстовый и графиче- 
ский режимы работы монитора. В данном разделе будут рассмотрены некоторые 
функции вывода текста в текстовом режиме. 
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Установка видеорежима (001 И 101) 


Любой дисплейный адаптер поддерживает несколько текстовых и графических 
режимов. Переключение между этими режимами производится с помощью функ- 
ции ООН те 101. 

Вход: АН = ООН, установить видеорежим: АЁ = номер видеорежима (если бит 7 
регистра А! = 0, то экран очищается, в обратном случае (А!.7 = 1) содержимое эк- 
рана не изменяется). 

Номеров видеорежимов много, нумерация режимов с высоким разрешением 
(УСА) зависит от производителя видеоадаптера, но на практике существует дос- 
таточно много $ЗУСА-режимов, поддерживаемых в качестве стандартных. Мы не 
будем приводить никаких сведений по этому поводу, при необходимости инфор- 
мацию о нумерации видеорежимов можно получить из соответствующих источ- 
НИКОВ. 


Установка позиции курсора (028 т ОН) 


Функция О2Н позволяет изменить позицию курсора и сделать ее начальной для 
последующего вывода. Заметим, что среди функций М$ ОО$ нет подобной функ- 
ции и функцию 021 1п 10Н ВТО$ можно использовать в комбинации со средствами 
М$ РО$ для организации форматированного вывода на экран. 

Вход: АН = О2Н — установить позицию курсора: ВН = номер видеостраницы (за- 
висит от используемого видеорежима); ОН = строка (001 — верх); ОЁ = колонка 
(ООВ — левая). 


Получение позиции курсора (ОЗВ тЕ ТОН) 


Функция ОЗ позволяет получить текущую позицию курсора. Аналогично сказан- 
ному выше, среди функций М$-00О$ нет подобной функции и функцию ОЗ 
106 ВТО$ также можно использовать в сочетании с функциями М$-ОО$. 

Вход: АН = 03В — получить позицию курсора; ВН = номер видеостраницы (зави- 
сит от используемого видеорежима). 

Выход: ОН = строка текущей позиции курсора (008 — верх); 0Ё = колонка теку- 
щей позиции (001 — левая); СН = номер начальной строки курсора; СЁ = номер по- 
следней строки курсора. 


Запись символа и его атрибута в видеопамять 
(О9н итЕ ТОН) 


Функция О9Н предназначена для записи АЗСП-кода символа и его атрибута не- 
посредственно в видеопамять, причем сделать это можно с количеством повторе- 
ний, заданных в регистре СХ. 

Вход: АН = 09Н — запись символа и его атрибута в текущую позицию курсора: 
ВН = номер видеостраницы; АЁ = АЗСП-код символа; ВЕ = байт-атрибут; СХ = число 
повторений. 

Для вывода одного символа содержимое регистра (Х должно быть равно 1. 
В текстовом режиме для СХ > 1 вывод осуществляется до конца текущей строки, 
после чего переходит на другую строку. 
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Кодировка байта-атрибута в этой и других функциях производится в соответ- 
ствии со следующими таблицами. 


и 


Кодировка цветов приведена в следующей таблице. 


Г [ярюйш о | 
000 
| [| Семей 
Желтый 

пн [ Свеможерый [| Баый 


Чтение символа и его атрибута из видеопамяти 
(О8Н те ТОН) 


В памятн видеоадаптера каждый символ представлен двумя байтами, содержащи- 
ми АЗСИ-код символа и его байт-атрибут. Функция 08| ВТО$ позволяет прочи- 
тать код символа и его атрибут непосредственно из видеопамяти. 

Вход: АН = 08Н — чтение символа и его атрибута в текущей позиции курсора; 
ВН = номер видеостраницы. 

Выход: АЕ = АЗСП-код символа; АН = байт-атрибут. 

Ниже приведена программа, которая устанавливает курсор в заданную пози- 
цию и производит другие действия. 
























;| Программа’ рг905_04.азт. Установка курсора в заданную позицию. | 
Е вывод строки и чтение символа из текущей позиции. Г 


1 
ма еее но + 
.соде 
ма?и: 
----- установка позиции курсора (10. 10) 
хог Бр. Ш 
оу 98. 10 
оу 91. 10 
МОУ ак. 028 
1 105 
;------ записываем символ и атрибут в видеопамять 
оу а]. "а" 
Ще Ы1. 100011006 —: атрибут — ярко-красный мигающий 
оу сх: 5 : повторить 5 раз 
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оу ай. 098 
ия 108 
у------ прочитаем символ из текущей позиции видеопамяти 
оу ап. 08п 
тие 10 
;------ выясним текущую позицию курсора 
хог Би, Ш 
[ео ап. 031 з 
17 10и 


а все результаты смотрим в отладчике 


Важно отметить, что текущая позиция курсора после выполнения функций 081 
и О9Н осталась неизменной. Отсюда следует важный вывод о том, что при исполь- 
зовании этих функций необходимо также заботиться и о движении курсора функ- 
цией о2Н. ВТО$ предоставляет функцию ОЕ, которая отображает символы в режи- 
ме телетайпа, предполагающем автоматическую корректировку текущей позиции 
курсора после вывода символа. 


Запись символа в видеопамять (ОАК и 101) 


Функция ОАК предназначена для записи АЗСН-кода символа с текущим значени- 
ем атрибута в данной позиции непосредственно в видеопамять, причем сделать 
это можно с количеством повторений, заданных в регистре СХ. 

Вход: АН = ОАН — запись символа в текущую позицию курсора; ВН = номер ви- 
деостраницы; АЁ = АЗСП-код символа; СХ = число повторений. 

Аналогично функции 091, текущая позиция курсора не изменяется. 


Запись символа в режиме телетайпа (ОЕН йт{ 101) 


Функция ОЕВ выводит символ в текущую позицию курсора с автоматическим ее 
смещением (в отличие от функций 091 и ОА). 

Вход: АН = ОЕН — запись символа в текущую позицию курсора; ВН = номер ви- 
деостраницы; А|. = АЗСП-код символа; СХ = число повторений. 

Запись символа в последнюю позицию строки автоматически переводит кур- 
сор в первое знакоместо следующей строки. 


Вывод строки (13ЗН и ТОН) 


Эта функция появилась в ВТО компьютеров архитектуры АТ. 

Вход: АН = 13Н вывод строки (АТ); А! = режим записи: бит 0 — после вывода 
курсор перемещается в конец строки; бит 1 — каждый символ в строке представ- 
лен двумя байтами: байтом с АЗСИ-кодом и байтом-атрибутом; биты 2-7 — ре- 
зерв; ВН = номер видеостраницы; ВЁ = байт-атрибут, если строка содержит только 
символы (АЕ.1 = 0); СХ = число символов в строке; ОН, 0Ё = начальные строка и стол- 
бец на экране; Е5:ВР — адрес в памяти начала строки. 

Обратите внимание, что содержимое строки для вывода может быть двух ти- 
пов: с байтом-атрибутом, сопровождающим каждый символ строки, и без него. 
В последнем случае строка состоит из одних кодов символов с единым значением 
байта-атрибута, указываемым в регистре ВЕ. 

Как видно, многие функции ВГО$ работают непосредственно с видеопамятью. 
Из-за того что для видеопамяти отводится определенный диапазон адресов (для 
текстового режима это начальный адрес 06800Н:00001), доступ к ней можно произ- 
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ВОДИТЬ обычными командами работы с памятью процессора, в том числе и цепо- 
чечными. 


Прокрутка окна вверх (О06Н и\{ 101) 


Функция О6Н позволяет определить на экране окно, в котором возможно прокру- 
тить определенное количество строк вверх. При такой прокрутке верхние строки 
исчезают и снизу добавляются пустые строки. 

Вход: АН = 06! — перемещение строк в окне вверх; АЁ = число строк для запол- 
нения снизу; ВН = атрибут символов (цвет) в строке для заполнения; СН и (4. = строка 
и столбец верхнего левого угла окна; ОН и 01 = строка и столбец нижнего правого 
угла окна. 

Строки для заполнения снизу имеют цвет, определенный в ВН. Если указать 
АЕ = 0, то окно очистится и заполнится строками с цветом, заданным байтом-атри- 
бутом в ВН. 

Ниже приведена программа вывода нескольких строк на экран, которая опре- 
деляет окно на экране и прокручивает его на несколько строк вверх. 


сы 

$&г1пд [619] "47513453637869шогаерввапв” 
Теп_$Ъг1пд = $ - $&г1ид 

адг_$&г1п9 04 $г1п9 

.с00е 
оу сх, 25 

т: оу а1, 1 . после вывода — курсор в конец строки 
хог Би, БИ : номер видеостраницы 
МОУ Ы, 7 : атрибут 
рии сх 
моу сх. 1еп ${г1пд :; дпина выводимой строки 


1е5 Бр. ааг_${г1пд : адрес строки в пару ЕЗ:ВР 
ед ав. 130 | 


Ия 108 
ИС [64 : строка начала вывода 
ТИС [в ; столбец начала вывода | 
рор сх 
100эр п 
------ определяем и прокручиваем окно вверх 
поу а1. 4 :; 4 строки 
поу Бр, 0 
оу ср. 5 
оу 1.5 
оу ди. 10 
поу 91. 30 
ОУ ан. 06 


176 108 
Заметьте, что функция 06Н достаточно гибко работает с курсором 


Прокрутка окна вниз (07Н и 1О0Н) 
Функция 07Н позволяет определить на экране окно, в котором возможно прокру- 
тить определенное количество строк вниз. При такой прокрутке нижние строки 
исчезают и сверху добавляются пустые строки 
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Вход: АН = 07Н — перемещение строк в окне вниз; А| = число строк для заполне- 
ния сверху; ВН = атрибут символов (цвет) в строке для заполнения; СН и С = стро- 
ка и столбец верхнего левого угла окна; ОН и 0Ё = строка и столбец нижнего право- 
го угла окна. 

Строки для заполнения сверху имеют цвет, определенный в ВН. Если указать 
АЁ = 0, то окно очистится и заполнится строками с цветом, заданным в ВН. Струк- 
тура байта-атрибута аналогична описанной выше. 


Функции М$ 00$ для работы с консолью 


Ценность программы прямо пропорцнио- 
нальна весу ее «выдачи». 


Прикладная Мерфология 


Функции М$ РО$ для работы с консолью сосредоточены в обработчике прерыва- 
ния 1тё 218. Они представляют собой набор средств работы с консолью, занимаю- 
щий промежуточное положение между программами пользователя и средствами 
ВТО$. Для достижения большей эффективности некоторые изфункций ВГО$ мож- 
но комбинировать с функциями М$ ОО5. Как пример такого полезного взаимо- 
действия можно привести задействование возможностей В[О$ по работе с курсо- 
ром. Как будет видно из приведенного ниже материала, среди функций М5 2О$ 
подобные средства отсутствуют. При выполнении конкретных практических за- 
даний можно найти и другие полезные примеры взаимодействия. 


Функции М$ 00$ для ввода данных с клавиатуры 


Для ввода данных с клавиатуры можно использовать два вида функций: универ- 
сальную функцию 3 (ввод из файла) и группу специализированных функций 
М$ 205 ввода с клавиатуры. 

Подробно использование функции ЗЁ для ввода данных рассматривается в гла- 
ве 7, а здесь сфокусируемся на второй группе, в которую входит семь функций, 
отличающихся друг от друга следующими характеристиками: 

: ожиданием ввода при отсутствии символа в буфере клавиатуры или только 
проверкой буфера на наличие символов для ввода; 


количеством вводимых символов; 
наличием «эха» при вводе, то есть дублированием набираемого на клавиатуре 
символа на экране; 

восприимчивостью к сочетанию клавиш (#+С (код 031). 


Чтение с эхом символа с клавиатуры (01Н и 211) 


Функция О1Н позволяет ввести один символ с клавиатуры. Если символа нет, то 
функция ожидает его ввода. Вводимый символ отображается на экране («эхо») 

Вход: АН = 01В — чтение символа с эхом. 

Выход: АЁ = АЗСП-код символа или 0. 

На выходе функция помещает в регистр АЕ АЗСИ-кол символа или 0. Наличие 
нуля в регистре АЁ говорит о том, что в буфере клавиатуры находится расширен- 
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ный АЗСП-код и необходимо повторить вызов функции с тем, чтобы прочитать 
его второй байт. Также функция 011 проверяет наличие в буфере символов нажа- 
тия комбинации (41+ (СШ +ВгеаК), при обнаружении которых производится вы- 
зов прерывания 1тЕ 23В. 

Для ввода нескольких символов данную функцию необходимо использовать 
в цикле. 


И 
$ёг1пд [69 5 @р (0) 
Теп_$1г1пд = $ - $1г1пд 
адг_$тг1пд 94 $ёг1пд 
.соде 
оу сх, Теп_51г1ид 
1е$ 91. адг_$г1ид 
м]: поу ап. 018 
тие 2 
стр а1. 0 ; расширенный код? 
Зпе 2 
4----- обрабатываем расширенный код 
Зтр 3 
Е: 5----- формируем строку символов 
5056 


13: р т 


Проверяя т программы, вместо ввода очередного символа введите комби- 
нацию С#1+С и посмотрите реакцию программы. 


Прямой ввод с эхом символа с клавиатуры (061 ит 211) 


Функция 06Н также позволяет ввести один символ с клавиатуры. Но, в отличие от 
функции 011, она не ожидает ввода при отсутствии символа в буфере. Вводимый 
символ отображается на экране («эхо»). 

Вход: АН = ОбН — чтение символа с эхом без ожидания; 0Ё = ОЙ — признак того, 
что функция О6Н используется для ввода; если 0Ё <> ОЁЪ, то функция вызывается 
для вывода символа (см. ниже). 

Выход: если 7Е = 0, то АЕ = АЗСП-код символа; если 22 = 1, то символа в буфере 
нет. 

Результаты работы этой функции необходимо оценивать прежде всего по зна- 
чению флага 7Е. Если 7Е = 0, то функция поместила в регистр АЕ АЗСП-код симво- 
ла или 0. Наличие нуля в регистре АЁ говорит о том, что в буфере клавиатуры нахо- 
дится расширенный А$СП-код и необходимо повторить вызов функции с тем, 
чтобы прочитать его второй байт. Функция О6П не проверяет наличие в буфере 
символов нажатия комбинации ©81+С (С++ ВгеаК). 


Чтение без эха символа с клавиатуры (071 й\ 211) 

Функция 07К аналогична функции 011, за исключением того, что читает символ 
с клавиатуры без ожидания его ввода, без «эха» и без проверки нажатия комбина- 
ции С1+с (СЫ+ВгеаК). 
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Вход: АН = 07Н — чтение символа без «эха». 

Выход: АЁ = АЗСН-код символа или 0 (см. описание функции 01Н 11 211) 

Наличие нуля в регистре АЁ говорит о том, что в буфере клавиатуры находится 
расширенный АЗСП-код и необходимо повторить вызов функции с тем, чтобы 
прочитать его второй байт. 


Чтение без эха символа с клавиатуры (088 и\{ 218) 


Функция 081 аналогична функции 011, за исключением того, что вводит символ 
с клавиатуры без отображения его на экране (без «эха»). 

Вход: АН = 08 — чтение символа без «эха». 

Выход: АЁ = АЗСП-код символа или 0 (см. описание функции 01Н Е 211). 

Наличие нуля в регистре АЁ говорит о том, что в буфере клавиатуры находится 
расширенный АЗСП-код и необходимо повторить вызов функции с тем, чтобы 
прочитать его второй байт. Отличие от предыдущей функции в том, что эта функ- 
ция производит проверку нажатия комбинации С +С (С+Втеак), при наличии 
которого вызывается прерывание 1 23В. 


Ввод строки символов с клавиатуры (ОАВ и 211) 


Функция ОАН вводит строку символов в буфер памяти специального формата. Если 
символов в буфере клавиатуры нет, то функция ожидает их появления. Конец вво- 
да — нажатие клавиши Етег (АЗСП-код О4П). Формат буфера: 


= первый байт буфера содержит количество символов для ввода с учетом симво- 
ла Оа|, прекращающего процесс ввода; 

* второй байт содержит реальное число введенных символов, но уже без учета 
завершающего символа ОН; 


® начиная с третьего байта размещается строка введенных символов с завершаю- 
щим символом ОЧ, максимальная длина строки — 254 символа. 


Вход: АН = бай — ввод строки в буфер (до 254 символов); 0$:0Х — адрес буфера, 
первый байт которого должен содержать количество символов для ввода. 

Выход: введенная строка, начиная с третьего байта буфера по адресу в 05:0Х, 
длина строки — во втором байте буфера. 

Перед вызовом функции ОАК в первый байт буфера необходимо поместить зна- 
чение максимальной длины строки. Если первый байт равен нулю, то вызов функ- 
ции игнорируется и программа продолжает выполнение без ожидания ввода строки. 
Функция производит проверку нажатия клавиатурной комбинации СН +С (СШ+ 
ВгеаК), при наличии которого вызывается прерывание 1 23Н. Вводимая строка 
отображается на экране. Буфер ввода для данной функции луче оформлять в ви- 
де структуры. 


БЫ ба $гис 

Теп_БиР [6 И ; длина БиГ дав 

Теп_1п [@!) 0 ; действительная длина введенного 
; слова (без учета 0АП) 

Бип [6 11 @р (200) : буфер для ввода (с учетом Оп) 


еп 
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„ата 

ЫТ Биг бай <> 

адг Бит 94 Би 
соде 


Ее вводим 10 символов с клавиатуры 
14$ 4х. ааг Биг 
оу ап. бай 
ИЯ 2 

у------ обработка введенной строки 


Получить состояние клавиатуры (ОВВ п 211) 


Функция ОВН проверяет наличие в буфере символа для ввода. 

Вход: АН = ОВК — проверка состояния клавиатуры. 

Выход: АЁ = О — буфер клавиатуры содержит символ для ввода; АЁ = 0 — бу- 
фер клавиатуры пуст. 

Данная функция формирует только логический результат — присутствует сим- 
вол в буфере или буфер пуст, поэтому вызов функции ОВН необходимо комбини- 
ровать с одной из функций извлечения символа из буфера ввода. Использование 
этой функции удобно для программ, управление которыми производится с клави- 
атуры, — типа командного процессора. В процессе своей работы они постоянно 
ожидают ввода пользователем управляющих команд, в связи с чем периодически 
проверяют входной буфер. 

Функция производит проверку нажатия комбинации СЕ+С (СЕ+ВгеаК), при 
наличии которого вызывается прерывание 1т% 23К. 


Ввод с клавиатуры с предварительной очисткой буфера 
(ОСИ мЕ 211) 


Функция ОСН выполняет ввод, предварительно очищая буфер клавиатуры. Это 
удобно для предотвращения чтения из буфера оставшихся там символов, возмож- 
но, введенных ошибочно или случайно. Функция гарантирует, что программа по- 
лучит именно те данные, которые ввел оператор. Важно отметить, что функция 
ОСН выполняет только очистку буфера, ввод символа осуществляет одна из функ- 
ций, номер которой указывается в регистре АЁ при вызове этой функции. 

Вход: АН = ОСН — ввод с клавиатуры с предварительной очисткой; АЁ = номер 
функции (01В, ОБН, 078, О8В, ав). 

Выход: определяется функцией, указанной в АЁ при вызове функции. 

Функция производит проверку нажатия комбинации С+С (СЕ+ВгеаК), при 
наличии которого вызывается прерывание 1тЕ 23Н. 


Функции М$ 00$ для вывода данных на экран 


Для вывода данных на экран можно использовать два вида функций: универсаль- 
ную функцию 401 (вывод в файл через дескриптор) и группу специализирован- 
ных функций М$ ОО5 вывода на экран. 

Использование функции 406 будет рассматриваться в главе, посвященной ра- 
боте с файлами. Материал, представленный ниже, посвящен второй группе функ- 
ций — для вывода символов на экран средствами М5 ОО5. В группу входят три 
функции. Рассмотрим их. 
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Вывод символа на экран (021 п\{ 218) 


Функция 02Н позволяет вывести один символ на экран. 

Вход: АН = О2Н — вывод символа; 01 = символ для вывода. 

Функция 02Н проверяет наличие в клавиатурном буфере символов нажатия 
комбинации С+С (СЕ1+ВгеаК), при обнаружении которых производится вызов 
прерывания 1т 231. В процессе работы функция реагирует на управляющие сим- 
волы, такие как ООН (возврат каретки), Оа| (перевод строки), О8Н (курсор назад на 
один символ), 07К (звуковой сигнал) ит. д. 

Здесь, для того чтобы вывести строку, необходимо организовать цикл. 


$Е^119 [69 "Строка для вывода функцией о2н" 
Теп_5г1пд = $ - ${г1тд 

соде 

Е выводим строку $№г1пд на экран 

оу сх. Теп_$4г1п9 ; длина строки 
Леа $1. $г1и9 ; адрес строки 
тоу ап. 020 

м1: тоу 1, [51] 
17ё 218 
ТИС $1 


100 т 


Прямой вывод символа на экран (068 шт 218) 


Функция О6Н выводит один символ на экран. Эта функция универсальна, так как 
используется и для ввода (см. выше), и для вывода символа. 

Вход: АН = ОбН — вывод символа на экран; 0Ё = символ для вывода (за исключе- 
нием ОЕ). 

Функция О6Н не проверяет наличие в буфере символов нажатия комбинации 
СЕИ+С (Сы+ВгеаК). Порядок использования данной функции аналогичен таковому 
для функции ОН. 


Вывод строки на экран (091 и" 211) 


Функция О9Н отображает строку символов на экране. Строка должна обязательно 
заканчиваться символом $. Данную функцию удобно использовать для вывода на 
экран различных диагностических сообщений. Если требуется организовать вы- 
вод строк, длина которых формируется динамически, то лучше либо прибегнуть 
к упомянутой выше функции 401, либо выводить их в цикле, тело которого содер- 
жит одну из функций — 021 или 06П. 

Вход: АН = 09В — вывод строки на экран; 0$5:0Х — адрес строки для вывода с за- 
вершающим символом $. 

Функция 09 проверяет наличие в клавиатурном буфере символов нажатия 
комбинации С1+С (СЕ (+ВгеаК), при обнаружении которых производится вызов 
прерывания 1 23Н. В процессе вывода она реагирует на управляющие символы, 
такие как ОЧ (возврат каретки), Оай (перевод строки), О8Н (курсор назад на один 
символ), 07В (звуковой сигнал) ит. д. 
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Приведенный ниже фрагмент показывает порядок применения функции 091 
Е 218. 


а 

${г1пд [19 "Строка для вывода функцией 09й $” 
адг_${г1пд 94 $&г1ид 

.соде 


:1----- выводим строку $(г1п9 на экран 
14$ 4х, абг_${г1пд ; адрес строки в 05:0Х 
то ап. 09п 
тие аи 


Работа с консолью в среде \ММпао\м/$ 


Если ничто другое не помогает, прочтите, 
наконец, инструкцию. 


Прикладная Мерфология 


М/пдоч/з поддерживает работу двух типов приложений — оконных, в полной мере 
использующих все достоинства графического интерфейса, и консольных, работа- 
ющих исключительно в текстовом режиме. Поэтому не следует путать понятие 
«консоли», используемое выше, с понятием «консольного приложения» УЛпао\5. 
В предшествующем материале под «консолью» подразумевались средства для ввода 
информации с клавиатуры и вывода ее на экран. Для однозначности изложения 
далее под термином «консоль» мы будем иметь в виду либо само консольное при- 
ложение, либо его видимую часть — окно консольного приложения. 

В главе 16 учебника были изложены основы программирования консольных 
приложений УЛ пдочх5. В этом материале была рассмотрена минимальная програм- 
ма консольного приложения и средства для автоматизации высокоуровневого 
консольного ввода-вывода. Поэтому, для экономии места, этот материал здесь 
рассматриваться не будет. Будут показаны лишь средства для организации низко- 
уровневого ввода-вывода. Те читатели, которые не собираются приобретать учеб- 
ник, могут найти необходимый материал среди файлов, прилагаемых к книге и 
выложенных насайте. Организация ввода-вывода в оконном приложении УЛпдо\з 
здесь также рассматриваться не будет, так как в главах 16 «Создание УЛп4о\з- 
приложений на ассемблере» и 17 «Архитектура и программирование сопроцессо- 
ра» учебника этот вопрос был рассмотрен очень подробно и полно. Что-либо су- 
щественное добавить к уже сказанному трудно. 


Организация низкоуровневого 

консольного ввода-вывода 

Низкий уровень консольного ввода-вывода, по сравнению с высоким уровнем, 
обладает более широкими и гибкими возможностями. Низкоуровневые функции 


консольного ввода-вывода обеспечивают прямой доступ к входному и экранным 
буферам консоли, предоставляя приложению доступ к событиям мыши и клаву- 
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атуры, а также кинформации об изменении размеров окна консоли. Функции низко- 
уровневого ввода-вывода позволяют приложению иметь доступ по чтению-записи к 
указанному числу последовательных символьных ячеек в экранном буфере или к 
прямоугольному блоку символьных ячеек в указанной позиции экранного буфера. 

Обсудим возможности низкоуровневого ввода-вывода на примере работы 
с входным буфером (входной очередью) и буферами экрана. Отметим, для работы 
сними существуют разные группы команд. Так, для операций с входным буфером 
используются функции низкоуровневого ввода-вывода — \У"ИеСопзо{епрш/ 
КеадСопо!еприе. Группа функций для работы с буферами экрана будет конспек- 
тивно описана в конце этого раздела. 


Поддержка работы с мышью в консоли 


Большое достоинство консольных приложений — встроенная средствами \пдо\$ 
поддержка мыши. Она реализуется с помощью функции КеадСопзо[еприе. Важно 
отметить, что эта функция предназначена для получения информации о событиях 
не только мыши, но и о событиях клавиатуры, изменении размера окна И т. д. 


ВОО Веа@Сопзо1еТприе (НАМОЕЕ ИСопзо1етриё. РТМРИТ ВЕСОВО ТрВиТРег. ОМОВО препоти. 
ЕРОМОЕО ТрмитбегОТЕуепе$Кеаа): 


Параметры этой функции: 
®_ ПСолзоеприЕ — стандартный дескриптор ввода, полученный функцией бе - 
Нап4(е; 


 |рВиНег — указатель на буфер, в который записывается информация о событии 
мыши, — эта область памяти имеет структуру, называемую ТМРИТ_ВЕСОВО, ее 
формат рассмотрен чуть ниже (необходимо заметить, что возможно групповое 
чтение информации из входного буфера, поэтому указатель (рВиЙег может ука- 
зывать на массив структур; информация о том, сколько событий будет читаться 
в этот массив структур, определяется параметром пЁепдЙ); 

# пЕепдЕ — размер буфера (во входных записях), на который ссылается указа- 
тель рВиНег; 


и рМитьЬегОГЕуе{Кеа@ — определяет переменную, в которую записывается дей- 
ствительное число прочитанных записей входного буфера. 


Запись входного буфера консоли имеет структуру, называемую 1МРИТ_КЕСОВО. 
Ее описание на языке С++ выглядит так: 


Фуреде? $ЕгисЕ _ТМРИТ_КЕСОКО { 
КОКО ЕуептТуре; 
иптоп { 
КЕУ ЕУЕМТ ВЕСОВО КеуЕуепе: 
МОИЗЕ ЕМЕМТ ВЕСОВО МоизеЕмепе; 
ИТМООИ ВИЕЕЕВ_512Е_ВЕСОВО \АпаомВиРег$л2еЕуеп; 
МЕМИ ЕМЕМТ ВЕСОВО МепиЁмепе: 
ОСИ _ЕМЕМТ_ВЕСОВО РосизЕмейе; 
} ЕмепЕ: 
} МРОТ ВЕСОВО; 


В этой структуре первое поле Еуеп Туре размером в слово содержит тип собы- 
тия, а второе поле Еуеп является объединением различных структур. Поля какой 
из структур будут заполнены, регламентируется типом события, то есть первым 
полем, которое может принимать значения: 
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» КЕ\У ЕМЕМТ = 0001 — поле Емепё содержит структуру КЕУ_ЕМЕМТ_ВЕСОКО с инфор- 
мацией относительно события клавиатуры; 

® МОЦЗЕ_ЕМЕЮТ = 00026 — поле Еуепе содержит структуру МОИ$Е_ЕМЕМТ_ВЕСОКО 
с информацией относительно движения мыши или нажатия ее кнопок; 

® УЛМООМ/ ВОЕРЕК_$Т2Е_ЕМЕМТ = 00046 — поле ЕуепЕ содержит структуру МЛМООМ_ 
ВОЕЕЕВ_5Т2Е_КЕСОКО с информацией о новом размере экранного буфера; 

® МЕМО_ЕУЕМТ = 0008Б — поле ЕуепЕ содержит структуру МЕМИ_Е\МЕМТ_КЕСОВО (это 
событие используется внутри УЛ т4о\з и должно игнорироваться); 
РОСИ$_ЕМЕМТ = 00106 — поле ЕуепЕ содержит структуру ЕОСИ$_Е\ЕМТ_ВЕСОВО 
(используется внутри \/1т4ом:з и должно игнорироваться). 
Для обработки события мыши структура МОЦ$Е_ЕМЕМТ_ВЕСОВО выглядит так: 


Туреде? $$гисё _МОЗЕ_ЕМЕМТ _КЕСОВО { 
С0080 @иМоизеРо$11оп; 
ОиОКО омВибопФате: 
ОМОВО амСопего1Кеуфа{е; 
РИОВО @мЕуепйЕТад$; 
} МОЦЗЕ ЕМЕМТ_ВЕСОКО; 


Исходя иэ вышесказанного, структура 1МРИТ_КЕСОКО для обработки событий 
мыши в программе на ассемблере должна выглядеть следующим образом: 
ТМРИТ ВЕСОКО — $%гис 
9 


ЕмепеТуре 0 
д»МоизеРо511оп $Егис 

х Ом 0 
у м 0 
епд$ 

ОмВитопбфафе Ом 0 
0мСопёго1Кеубфафе дм 0 
иЕует&Е1ад$ [6 0 
епа$ 


Поле ЕуегТуре для события мыши содержит значение МОЦ$Е_Е\УЕМТ = 00021, 
а поля структуры МОЦУ$Е_Е\МЕМТ_ВЕСОКО соответственно означают следующее: 

4и/МоизеРо$И Топ — координаты мыши в окне консоли (в знакоместах); 

дмВиопбЕайе — состояние кнопок мыши в момент возникновения события, при 

нажатии кнопок устанавливаются следующие биты (при одновременном на- 

жатии устанавливается несколько битов): 

О если установлен бит 0 поля дмВиНоп$ате, то в момент наступления события 
была нажата левая кнопка мыши; 

О если установлен бит 1 поля дмВимопбае, то в момент наступления события 
была нажата правая кнопка мыши; 

ОС если установлен бит 2 поля дмВиНоп$1ате, то в момент наступления события 
была нажата средняя кнопка мыши, если она есть; 

диСопгоКеуб+ае — поле описывает состояние управляющих клавиш клавиату- 

ры в момент наступления события мыши (если одновременно нажато несколь- 

ко клавиш, то эначение в этом поле является результатом операции логическо- 

го сложения (ИЛИ) перечисленных ниже значений): 

о КСНТ_АТ_РВЕЗЗЕО — 0001 — нажата правая клавиша АЕ; 


о ЕЕ _АП_РВЕЗЗЕО = 00026 — нажата левая клавиша А; 
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ВТСНТ_СТВЕ_РКЕЗЗЕО = 0004Ъ — нажата правая клавиша СЫ; 
ТЕРТ_СТВЬ_РВЕЗ$ЕО = 00086 — нажата левая клавиша С; 
ЗНТЕТ _РВЕЗЗЕО = 0010} — нажата любая клавиша $НТЕТ; 
МИМОСК_ОМ = 0020} — индикатор Мит ЁосК включен; 
$СКО40СК_ОМ = 00406 — индикатор $сгоЦ 1оск включен; 
САРЗШОСК_ОМ = 00801 — индикатор Сарз 10сК включен; 


ЕМНАМСЕО_КЕУ = 01006 — нажата клавиша расширенной клавиатуры (101 
и 102 клавиши): 1пз, Ое|, Ноте, Епд, Раде Ир, Раде ом, <, Т, , 1, / или Епег; 


ЧмЕуепНад$ — поле содержит одно из двух значений: 
С МОЦ$Е_МОУЕО = 0001} — перемещение мыши; 
С ОООВЕЕ ССК = 00026 — выполнен двойной щелчок кнопки мыши. 


Среди материалов, прилагаемых к книге, имеется демонстрационная програм- 
ма обработки событий мыши (рг905_13.азт), которые отслеживаются следующим 
образом: нажатие левой кнопки приводит к выводу сообщения в позиции нажа- 
тия, нажатие правой кнопки влечет за собой завершение работы программы. 

Взаключение обращу внимание читателя на то, что АР| \/1п32 имеет функцию 
Моизе_Емепё, которая позволяет генерировать события, соответствующие реальным 
движениям мыши и щелчкам ее кнопок. Тем самым АР1 \т32 предоставляет ме- 
ханизм для создания обучающих и демо-версий программ. Формат этой функции: 
УОТО пюизе_еуеп(0мОВО @мЕТад$. ОМОВО Чх. О№ОЕО ду. РАОКО @мОафа. ОМОКО дмЕхёгаТтто) 


обооооо 


Расширенная поддержка клавиатуры в консоли 


Функции работы с текстом высокого уровня не дают других возможностей опери- 
рования клавиатурой, кроме как примитивного ввода текста. При разработке про- 
грамм текстового режима часто требуется информация о состоянии управляющих 
клавиш, о факте удержания клавиши, что может свидетельствовать о желании 
пользователя повторить ввод некоторого символа или просто о желании получить 
тривиальный скан-код клавиши. Эти и другие события клавиатуры доступны про- 
грамме посредством описанной выше функции КеадСопзо(е] при. 

События клавиатуры генерируются при нажатии любой клавиши. Процесс их 
обработки аналогичен обработке событий мыши. В первую очередь заполняется 
экземпляр структуры 1МРОТ_КЕСОВО. При этом в поле Еуеп Туре помещается значе- 
ние КЕ\У_ЕУЕМТ = 00016 — это означает, что объединение ЕуепЕ содержит структуру 
КЕ\_Е\УЕМТ_КЕСОВО с информацией относительно события клавиатуры. Указанная 
структура включает в себя следующие поля: 


{уредет $&гисЕ _КЕ\ ЕУЕМТ ВЕСОЮО { 
ВООЕ БКеубомп; 
МОВО КереаЕСоит:; 
ОКО мА гфиа1КеуСоде: 
ОВО мУ1гбиа1$сапСоае; 
иптой { 
ИСНАК ИптсодеСпаг: 
СНАВ — АзсттСваг: 
} чСпаг: 
04080 ОмСопего1Кеуфауе: 
} КЕУ ЕМЕМТ ВЕСОВО. *РКЕУ _ЕМЕМТ ВЕСОКО; 


Тот же код в переводе на язык ассемблера: 
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КЕУ ЕМЕМТ_ВЕСОКО $%гис 
[91° 


Вкеубоипт 0 
игереа{Соипе [6 0 
иу1га1Кеубоде — Ом 0 
иузгеиа]$сапбоде м 0 
ипТой 

уплсодеСпаг [6 0 
Азст1Снаг 6 0 
епд$ 

9мСопёго1Кеу$ате 4 0 
еп4$ 


Поля этой структуры означают: 
® ВКеубомп — содержит 1 («истина»), если клавиша была нажата, и 0 («ложь»), 
если клавиша была отпущена; 


" \МТереаЕСоипЕ — содержит количество повторных кодов при удержании клави- 
ши в нажатом состоянии; : 

МллиаКеуСоде — содержит виртуальный код клавиши, который идентифици- 

рует данную клавишу не зависящим от устройства способом; 

МАЛикиаСсапСоде — содержит виртуальный скан-код данной клавиши, который 

представляет собой аппаратно-зависимое значение, сгенерированное аппарат- 

ными средствами клавиатуры; 

объединение АзсИСКаги УтсоЧеСКаг — содержит либо АЗСП-код клавиши, либо 

Озмсоде-код; 

ОмСопегоКеу5Еае — описывает состояние управляющих клавиш (это поле со- 

держит такие же значения, как и аналогичное поле в структуре, описывающей 

события мьипи: ЕТСНТ_А!Т_РКЕЗЗЕО, 1ЕЕТ_АЕТ_РКЕЗ$ЕО, КТ6НТ_СТКЕ_РКЕЗЗЕО, [ЕЕТ_ 

СТВЬ_РКЕ$$ЕО, $НТЕТ_РКЕЗ$Е0, МОМЕОСК_ ОМ, $СКОГОСК_ОМ, САРЗУОСК_ОМ, 

ЕМНАМСЕО_КЕУ). 

Среди материалов, прилагаемых к книге, есть демонстрационная программа 
обработки событий клавиатуры (рг905_14.азт). Она построена на основе предыду- 
щей программы и дополняет ее возможностью обработки событий клавиатуры, 
сообщая пользователю о нажатии некоторых управляющих клавиш. Для всех ос- 
тальных клавиш просто фиксируется факт нажатия. При этом необходимо помнить, 
что однократному нажатию клавиши реально соответствуют два события — нажа- 
тие и отпускание клавиши. В связи с этим программа выводит два сообщения. На 
практике избыточности можно избежать, анализируя поле БКеудомт: БКеудомт = 1, 
когда клавиша нажата; БКеудомт = 0, когда клавиша отпущена. Выход из програм- 
мы — при выполнении любых действий с мышью. 


Окно консоли и экранный буфер 

В заключение обсуждения особенностей работы с консольными приложениями 
разберемся, что представляет собой экранный буфер консоли и какие средства 
представляет АР] \/1п32 для работы с ним. 

Для того чтобы легко понять соотношение понятий «окно консоли» и «экран- 
ный буфер консоли», представьте себе офисный календарь, на котором текущее 
число отмечается квадратной рамкой, закрепленной на прозрачной целлофановой 
ленте и перемещающейся вдоль нее. Теперь представим, что содержимое листа 
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календаря вне этой рамки невидимо, то есть доступно только через окошко, кото- 
рое образует рамка. Для того чтобы увидеть содержимое всего листа календаря, 
необходимо двигать рамку. В контексте этой ассоциации — лист календаря — это 
экранный буфер (логический экран), а площадь внутри рамки — окно консоли, то 
есть видимая часть экранного буфера. 

Возможна поддержка нескольких экранных буферов, связанных с данной кон- 
солью, но только один из них может подвергаться отображению в окне консоли — 
его называют активным экранным буфером. Другие экранные буферы, если они 
были созданы, являются неактивными. Для создания экранного буфера использу- 
ется функция СгеаеСопзо!ебсгеепВиЙег. К. неактивным экранным буферам можно 
обращаться для чтения и записи, но отображаться в окне консоли будет только 
активный экранный буфер (или его часть). Для того чтобы сделать экранный бу- 
фер активным, вызывается функция 5еСопзо{еАсйуе$сгеепВийЙег. Функция Стеаёе- 
Сопзо[е$сгеепВиЙег имеет показанный ниже формат. 


НАКОЕЕ СгеатеСопзо1е5сгеепВи Рег (иОКО дм0ез1гедАссез$. ОиОКО ОмопагеМоде. 
СОМЗТ ЕРЗЕСИРКТТУ АТТЕТВИТЕ$ 1р$бесигКуАНиг1Рибез. ОМОВО ФЕ Задз. 
ЕРМОТО 1р5сгеепВиРегОава); 


Параметры функции: 

4мОезиедАссе$$ — определяет желаемый тип доступа к экранному буферу кон- 

соли, этот параметр может быть одним из следующих значений либо их комби- 

нацией: 

С СЕМЕВТС_КЕАБ = 800000006 — запрашивается доступ по чтению к экранному 
буферу консоли для того, чтобы разрешить процессу прочитать данные из 
буфера; 

О СбЕМЕЕГС_МЕПЕ = 400000006 — запрашивается доступ для записи к экранно- 
му буферу консоли для того, чтобы разрешить процессу записать данные 
в буфер; 

» (м5КагеМоде — определяет возможность разделения экранного буфера консо- 
ли; нулевое значение этого параметра указывает, что буфер не может быть раз- 
делен, ненулевое состояние параметра может быть одним из следующих значе- 
ний или их комбинацией: 

о Е\Е $НАВЕ_ВЕАО — другие операции открытия могут быть выполнены для 
экранного буфера консоли с доступом для чтения; 

с ЕЕ _$НАВЕ_МЕПЕ — другие операции открытия могут быть выполнены для 
экранного буфера консоли с доступом для записи; 

рбесиуА Би е$ — указатель на структуру $ЕСУКПУ_АТТЕТВИТЕ$, которая оп- 

ределяет, может ли возвращаемый функцией СгеаеСопзое5сгеепВийег дескрип- 

тор наследоваться дочерними процессами, — если [р$есиТуАЕЕйБие$ = МИЦ, то 
дескриптор не наследуется; 

4мЕа9$ — определяет тип создаваемого экранного буфера консоли, в настоящее 

время поддерживается только один такой тип — СО№$ОЕЕ_ТЕХТМООЕ_ВУЕЕЕК = 1; 

(р5$сгеепВиНега{а — зарезервирован и должен быть равен МИЦ. 


Функция СгеайеСопзо(е$ сгеепВиНег формирует дескриптор созданного экранно- 
го буфера, который затем используется функциями для доступа к этому буферу. 
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Для того чтобы сделать буфер активным, задействуют функцию $е{Сопзо{е- 
АсНуе5сгеепВийЙег. 

ВООЕ Зе{СопзоТеАсЕлуесгеепВи Тег (НАМОЕЕ пСоп$о1едири®): 

Функция имеет единственный параметр — НСопзо(еОшриЕ — дескриптор экран- 
ного буфера, созданного функцией Сгеа{еСопзо(е$ скеепВиЙег. Как уже было отмече- 
но, консоль в состоянии иметь много экранных буферов. Функция $еСопзеАсвуе- 
5сгеепВийЙег определяет, какой из них будет отображен. Приложение может про- 
изводить запись в неактивный экранный буфер и затем обращаться к функции 
беСопзо{еАсНуеб сгеепВи ег для отображения содержимого буфера. Чтение и за- 
пись в неактивный (и активный тоже) экранный буфер производится функциями 
низкоуровневого ввода-вывода — ММ\еСопзо{еОбири/И М еСопзоеОцЕриСпагасвег и 
КеаСопзоеОитри /ВеадСопзо(еОцЕри{СВагасеег, которым при вызове передается де- 
скриптор нужного экранного буфера, полученного предварительно функцией 
СгеаеСопзо\е5стеепВиЯег. 

Каждый из созданных экранных буферов поддерживает собственный текущий 
прямоугольник окна, определяемый координатами верхней левой и нижней пра- 
вой символьных ячеек, которые будут отображены в окне консоли. Для определе- 
ния видимого в окне консоли прямоугольника экранного буфера используется 
функция беСопзо{ебсгеепВиЙе п. 


ВОО бееСопзо1е5сгеепВи Рег тТо(НАМОЕЕ ВСопзо1ебифрие. 
РСОМЗОЕЕ_5СКЕЕМ ВЫЕРЕК_ТМЕО 1рСопзоТебсгеепВи Рег пТо) ; 


Параметрами этой функции являются: 
®_ НСопзоеОЦЕриЕ — дескриптор экранного буфера, созданного функцией Сгеае- 
Сопзо[е$сгеепВийЙег; этот идентификатор должен иметьтип доступа бЕМЕЕТС_КЕАД; 
й рСопсоебстеепВи Не и — указатель на структуру СОМ№$ОЕЕ_$СВЕЕМ_ВИЕЕЕВ_ТМРО, 
в которую помещается информация об экранном буфере. 
Структура СОМ$ОТЕ_$СКЕЕМ_ВИЕРЕВ_1МЕО имеет следующий вид: 
уредеР з&гисё _СОМЗОГЕ_ЗСВЕЕМ ВИЕРЕВ_ТМЕО { 


С0080 Чиб1ге; // размер экранного буфера в колонках и строках 
00080 Ч9иСигзогРо$ 11 оп; // координаты столбца и строки курсора 

// в экранном буфере 
МОВО мАССг1Биез; // цвет фона и текста. с которыми записываются 


// и отображаются символы в экранном буфере 
// функциями игл берт1е/мг1{еСопзо]е и 
/! ВеадЕ11е\ВеадСопзо1е 

УМАН: ВЕСТ $г\1пдом: // определяет структуру ЗМАН: ВЕСТ. которая 
// содержит координаты левого верхнего и нижнего 
// правого углов экранного буфера. 
/{! видимого в окне консоли на экране дисплея 

С008о Ч,Мах1тити1п0ом512е; // определяет максимальный размер окна консоли 
// с учетом текущего размера экранного буфера 
// и ирифт 

} СО№$ОЕЕ_$СВЕЕМ ВЫЕЕЕК_ТМЕО ; 


Для приложения интерес, в частности, представляет параметр $ тдом с коор- 
динатами видимой части экранного буфера. Далее, руководствуясь действиями 
пользователя (выполняющего прокрутку окна или изменение его размера) по от- 
ношению кокну консоли, приложение может изменять значения в структуре $МАЦ-_ 
ВЕСТ и передавать ее на вход функции $еСопзо[еМИпао\ то, которая устанавливает 
текущий размер и позицию окна консоли относительно экранного буфера. 





Работа с консолью в среде Мипаом$ 197 


ВОО еЕСопзоТей1 паом1пТо(НАМОЕЕ НСопзо1ебитриг. ВОО БАБ$о]ите. 
СОМ№Т ЗМАЦЕ ВЕСТ *1рСопзоТей1паом) ; 


Параметрами этой функции являются: 
НСопзо(е0иёриЕ — дескриптор экранного буфера, созданного функцией Сгеае- 
Сопзое$сгеепВийег; этот ндентификатор должен иметь тип доступа СЕМЕВТС_ 
МЕТТЕ; 
БАБзоие — определяет порядок использования координат в структуре, указан- 
ной параметром (рСопзоеМАидом; если БАБзоШе = 1 («истина»), то координаты 
определяют новые левый верхний и нижний правый углы окна; если БАБбо- 
№Ше = 0 («ложь»), то координаты — смещения относительно текущих коорди- 
нат углов окна; 

* рСопзо[еМАпдом — указатель на структуру $МАМ _ВЕСТ, в которую записывается 
информация о новых координатах экранного буфера. 
Структура $МАЦ._ВЕСТ имеет следующий вид: 

ТуредеР $гис® _5МАМ. ВЕСТ { 


УНОВТ [еТ(: /! х-координата верхнего левого угла 

ЭНОВТ Тор: // у-координата верхнего левого угла 

УНОРТ В19%: // х-координата нижнего правого угла 

УНОКТ Вот: /!/ у-координата нижнего правого угла 
} 5МАН. ВЕСТ; 


При работе с функцией $еСопзо(еМИпдом/т® следует иметь в виду, что она возвра- 
щает ошибку (нулевое значение), если координаты видимой части экранного буфера 
указывают за его действительные границы. Максимально допустимый размер окна 
для данной консоли можно получить с помощью функции бе Сопзо [еб сгеепВиЙе п. 
Таким образом, обе эти функции подходят для листания экранного буфера. 

Для закрытия экранного буфера используется функция (о5еНапще, которой 
передается идентификатор закрываемого экранного буфера. 

ВОО. СТозеНапоТе(НАКОЕЕ иОБ3ес®):; 

Для того чтобы завершить рассмотрение функций, предназначенных для 

поддержки консольного приложения, перечислим те из них, что остались «за 


кадром». 


ОО ООО 


Е СопзоеОиЕриАсетфие Устанавливаст цвет текста и фона для указанного 


числа символьных ячеек, начинающихся 
Е СопзоеОиЕри СВагасёег 


по указанным координатам в экранном буфере 
Е $ Сопзое при Вийег 

















Запись символа в экранный буфер указанное число 
раз по указанным координатам 


Сброс на диск входного буфера консоли. Все входные 
записи во входном буфере консоли до настоящего 
момента времени удаляются 


СепегабеСопзеСЬЧЕуеп Посылка сигнала, определенного этой функцией, 
совместно использующим консоль процессам 


СеСопзеСигзо п Предоставление информации о размере и видимости 


курсора для указанного экранного буфера 
продолжение =? 
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ук ин | 


Се(СопзоеМо4е Предоставление информации о текущем входном 
режиме входного буфера консоли или текущем 
режиме вывода экранного буфера консоли 












Извлечение строки из области заголовка ДлЯ 
текущего окна консоли 


СеСоп5ое' Те 













Возвращает размер самого большого возможного 
окна консоли, основанного на текущем шрифте 
и размере изображения 


Се агвез(Сопзое\/тадом ие 















Возвращает число непрочитанных записей ввода 
во входном буфере 


СеМитЬегО Сопзое при Емеп($ 











Сей\митЬегО Сопз еМоизеВиоп$ | Возвращает число кнопок на мыши, 


используемых те кущей КОИСОЛЬЮ 









Чтение данных из входного буфера консоли без 
их удаления 


РееКСопзоеТприе 














ЗсгоНСопзо!еЗсгеепВийег Перемещение блока данных в экранном буфере. 
Действие перемещения может быть ограничено 
путем определения отсекающего прямоугольника. 
Содержание экранного буфера вне отсекающего 


прямоугольника будет неизменным 













ЗеСопзоеСигзо тю Установка размера и видимости курсора 
для указанного экранного буфера консоли 










Установка режима входного буфера консоли 


Зе Соп$оеМо4е 
а или режима вывода экранного буфера консоли 






Изменение размера указанного экранного буфера 
консоли 


Зе СопзоеЗсгеепВийетг ле 






ЗеуНап е Установка некоторого дескриптора как 


дескриптора стандартного ввода, стандартного 
вывода или устройства ошибки. Может 
использоваться при перенаправлении 
ввода-вывода 








Глава 6 
Преобразование чисел 


Внутри каждой большой задачи сидит маленькая, 
пытающаяся пробиться наружу. 


Закон больших чисел Хоара (Прикладная Мерфология) 


В предыдущей главе мы рассмотрели решение проблемы обмена данными с консо- 
лью. Данные, вводимые с консоли и выводимые на нее, кодируются операционной 
системой в соответствии с текущей таблицей кодировки. Отдельный предмет об- 
суждения при этом — процесс ввода-вывода числовой информации. В каждом 
языке программирования он реализован по-своему. Одна из целей, к которой стре- 
мятся разработчики компиляторов, — по возможности сделать этот процесс про- 
зрачным для программиста. Язык ассемблера, в отличие от языков высокого уровня, 
не обладает средствами такого прозрачного ввода-вывода числовой информации. 
Но в этом и состоит его достоинство, так как при определенном опыте и квалифи- 
кации программиста появляется хорошая возможность повышения эффективно- 
сти конечного кода. 

Для каждой конкретной задачи преобразование чисел между различными пред- 
ставлениями, допустимыми компьютером, может быть выполнено несколькими 
способами. Для эффективного решения задач обработки числовой информации 
программист должен знать эти способы и уметь выбрать наиболее подходящий из 
них для решения конкретной проблемы. Сразу следует отметить, что эта тема да- 
леко не нова. Многие источники, посвященные ассемблеру, с той или иной степе- 
нью подробности рассматривают проблему преобразования чисел. И хотя здесь 
трудно придумать что-то новое, эта тема заслуживает того, чтобы ей было уделено 
место в книге, посвященной вопросам прикладного программирования на ассемб- 
лере. В данной главе сделана попытка систематизированно рассмотреть различ- 
ные существующие подходы к решению проблемы ввода-вывода числовой инфор- 
мации и ее преобразованию во внутреннее представление в компьютере. 

Начнем с того, что вспомним главу 2 «Программно-аппаратная архитектура МП 
ГАЗ2» учебника, где приведена классификация типов данных, допустимых про- 
цессорами Репнйит Ш/А. Для нашего изложения важно то, что они делятся на две 
большие группы — данные целочисленного и вещественного типов. Причем цело- 
численные данные можно разделить на две подгруппы: двоичные и двоично-де- 


200 Глава 6. Преобразование чисел 


сятичные (ВСО-числа). Исходя из этого, постараемся сформулировать направ- 
ления преобразований числовой и символьной информации, востребованные 
на практике. 


При обмене с консолью допустимы следующие преобразования: 


* десятичные целые числа в символьном виде <> внутреннее двоичное представ- 
ление; 


ыы щестнадцатеричные целые числа в символьном виде <> внутреннее двоичное 
представление; 


” двоичные целые числа в символьном виде <> внутреннее двоичное представле- 
ние; 

- десятичная дробь в символьном виде <> внутреннее представление в виде ве- 
щественного числа; 


дробное шестнадцатеричное число в символьном виде <> внутреннее представ- 
ление в виде вещественного числа; 


дробное двоичное число в символьном виде <> внутреннее представление в виде 
вещественного числа. 


Взаимное преобразование между внутренними представлениями: 
двоичное число <> двоично-десятичное число; 
двоично-десятичное число <> вещественное число; 

*_ двоичное целое число => вещественное число. 


Рассмотрим основные способы выполнения некоторых из этих видов преобра- 
зований. В своих рассуждениях будем предполагать, что числа положительные. 
Если вы внимательно изучили материал глав 6 и 8 учебника, а также главы 1 этой 
книги, посвященной программированию арифметических операций над двоичны- 
ми и двоично-десятичными числами, то вы легко сможете дополнить приведен- 
ные ниже программы возможностью учета знака при выполнении соответствую- 
щих преобразований. 


Ввод чисел с консоли 


Вэтом разделе разберем способы преобразования десятичных целых и веществен- 
ных чисел, вводимых с консоли в символьном виде, в соответствующее им внут- 
реннее двоичное представление. Начнем с целых десятичных чисел. Заметим, что 
этот вид преобразования является наиболее востребованным на практике. Далее 
будет обсуждена проблема преобразования вещественных чисел. 

Выбор способа перевода десятичных целых чисел из символьного во внутрен- 
нее двоичное представление и обратно определяется диапазоном возможных исход- 
ных значений. Разберем два способа. 


Ввод целых десятичных чисел из диапазона 0-99 


Для значений из диапазона 0-99 взаимное преобразование между символьной де- 
сятичной и двоичной формами может производиться командами умножения и де- 
ления двоично-десятичных (ВСО-чисел) — ААМ и ААО. 


Ввод чисел с консоли 201 


:| Программа: рг906_01.а5т. Ввод с консоли двоичного числа из диапазона 0-99 | 
:| в десятичном символьном представлении. 


:| Вход: число в десятичной системе счисления. вводимое в символьном виде | 
$ с клавиатуры. 


еее не - + 

;]| Выход: АЁ - двоичное число. ] 

еее ----- + 

Бит 0ай $гис 

Теп_ Быт ОБ 3 ; длина БиЁ бай 

Чеп_1п [91 0 ; действительная длина введенного слова 
: (без учета дон) 

ых 1п [в]. 3 ар (201) : буфер для ввода (с учетом ай) 

епд$ 

„даба 

БЕ Биг бай => 

адг_ Бит 99 Би 

.соде 


у------ вводим 2 символа с клавиатуры. 

; контроль на допустимые значения не делаем 
14$ ах. абг_ Би? 
ЮУ ан. бай 


Ти Ра 

хог ах. ах 

стр Бит. 1еп_1п. 2 ; сколько чисел введено реально? 
пе м1 


оу ай. БыР.Бое 1п 
;------ преобразование в неупакованное десятичное представление 


м1: ОУ а1. Би. Бит 1п+1 
апа ах. ОТО 
ааа ; ва1 двоичный эквивалент исходного 


; двузначного десятичного значения 


Ввод целых десятичных чисел из диапазона 
0—4 294 967 295 


Если исходное значение выходит за диапазон 0-99, то здесь следует иметь в виду 
возможность возникновения ситуации, при которой значение вводимого десятич- 
ного числа превышает диапазон, допустимый форматами типов целочисленных 
данных, поддерживаемых, в частности, арифметическими командами процессора. 
Для Репиит Н4 это 8, 16 и 32 бита. Диапазоны значений для этих форматов 
(числа без знака): 

для операнда размером 8 битов — 0-—255; 
® для операнда размером 16 битов — 0-65 535; 
* для операнда размером 32 бита — 0-4 294 967 295. 


Как видите, максимальное число не такое уж и большое. Поэтому мы столько 
внимания уделили работе с числами большой размерности в главе 1, посвященной 
программированию арифметических операций. В ней данные большой размерно- 
сти просто описывались в сегменте данных без какого-либо намека на возможность 
их ввода с консоли или отображения на ней. В этом разделе мы постараемся лик- 
видировать упущение, что несомненно поднимет привлекательность для читателя 
того и другого материала. Но вначале мы рассмотрим способы преобразования 
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значений, которые укладываются в указанные выше диапазоны. Для этого можно 
предложить два способа преобразования в символьном представлении десятич- 
ных чисел, вводимых с консоли: посредством десятичного полинома и с использо- 
ванием возможностей сопроцессора по обработке данных. 

В основе способа с десятичным полиномом лежит возможность представления 
десятичного числа суммой произведений на степени числа 10 составляющих его 
десятичных цифр, которые соответствуют позициям этих цифр в исходном числе: 


дах а в тах ах" 
Вычисление данного полинома лучше производить по схеме Горнера: 
Ата хата) 10 та, 
Например, число 3405 по этим формулам может быть представлено так: 
3405 = 3х 103+ 4х 102+ 0х 101+ 5х 10° = (((0+3)х10+4)х10+0)х10+5. 


Ниже приведена программа преобразования целого десятичного числа в сим- 
вольном виде из диапазона 0—4 294 967 295 в эквивалентное двоичное представле- 
ние. Для ввода числа с клавиатуры используем функцию 3 М$ ОО$. Она удобна 
тем, что возвращает количество действительно введенных символов в регистре А". 


2 Программа: рг906_02.азт. Преобразование целого десятичного числа 
:| в символьном виде из диапазона 0-4294967295 в двоичное представление. | 


Вход: ввод с клавиатуры числа в десятичной системе счисления ] 
(не более 10 цифр). ] 


И 
$&г1п9д [619] 12 Чир (0) ; максимальное число состоит из 10 цифр 
; (12 - с учетом 080ап) 
Теп_$гтид = $ - %ги9 
фей 39 10 
$&г1пд_е 96 Сан. бан. “Результат вышел за границы операнда !!!$“ 
адг_${г1п9е 06 $ёг1лд_е 
.соде 
але: вводим С клавиатуры. 
: в А- — количество действительно введенных десятичных цифр 
оу Ьх. 0 ; стандартный дескриптор — клавиатура 
оу сх. Теп_5г1т9 
Зеа 4х. $г1пд ; формируем указатель на строку $г1пд 
ОУ ак, зв : номер функции 005 
ция 21и 
3 ех1ё ; переход в случае ошибки 
1------ преобразование 
[в есх. еах 
$иБ есх. 2 : корректируем счетчик цикла (чтобы 
; не учитывать 090ай. вводимые ЗТН) 
3есхх ехИи ; число не было введено 
дес есх ; не умножать на 10 последнюю цифру числа 
Зесхх м2 : введено однозначное число 
}еа $1. 5$&г1п9 : формируем указатель на строку $\г7пд 
хог еах. еах ; еах:=0 
т]: хог ейх. ебх 
ОУ 91. [$1] 
апб 91. о 


а34 еах. ебх 
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[И феп 
3с ех1 фе ; результат вышел за границы операнда 
Тис $1 
Тоор т] 
2: ОУ Ч. [$1] 
апб 1. от : преобразуем АЗСТТ->ВС0 
ава еах. едх : результат преобразования в регистре ЕАХ 
тс ех1Е : результат вышел за границы олеранда 


а ‚ ВыВОДИМ строку $+г1пд_ е на экран 
еже: 


При ОбоДимьсте вы можете изменить программу так, чтобы в ней использо- 
вались регистры меньшей разрядности. 


Ввод целых десятичных чисел из диапазона 
0-—999 999 999 999 999 999 


Второй способ преобразования десятичных чисел, хотя и выглядит несколько эк- 

зотически, вполне работоспособен. Данный подход предполагает использование 

особенностей некоторых команд сопроцессора. В материале главы 17 «Архитекту- 

ра и программирование сопроцессора» учебника мы перечисляли форматы дан- 

ных, которые поддерживает сопроцессор. Перечислим их еще раз: 

» двоичные целые числа в трех форматах — 16, 32 и 64 бита; 

упакованные целые десятичные (ВСО) числа — максимальная длина — 18 упа- 
кованных десятичных цифр (9 байтов); 

я вещественные числа в трех форматах — коротком (32 бита), длинном (64 бита), 
расширенном (80 битов). 

Для нас интерес представляют форматы целых двоичных и упакованных 
десятичных (ВСО) чисел. а также команды обмена этими значениями с вер- 
шиной стека сопроцессора. Процесс преобразования десятичного целого чис- 
ла, вводимого с клавиатуры, показан в программе ниже. Необходимо отметить, 
что этот способ преобразования позволяет расширить диапазон значений до 
0-999 999 999 999 999 999. 


Программа: рг906_03.а$т. Ввод целых десятичных чисел из диапазона | 
: 0-999 999 999 999 999 999 и преобразования их в двоичное представление. | 


| Вход: ввод С клавиатуры числа в десятичной системе счисления | 
= в диапазоне значений 0-999 999 999 999 999 999. ] 


ен - + 
:| Выход: $&г1п9 Би - двоичное число - результат преобразования. | 
+ + 
Саха 
[9 0 : барьер. если введенное количество 
: ЦИфр нечетно 
Зег1и9 [13 20 дир (0) ; максимальное исходное число состоит 


: из 18 цифр (20 - с учетом 0абав) 
Теп_${г1п9 = $ - $1г119 
абг_$&г1п9 04 $4г1пд 


$&глпд_раск [ея 0 ; сюда упаковывается исходное значение 
1Теп_54г1и9 раск = $ - $4г1пд_раск 
адг —5г1по_ раск ва $&г1ид_раск 


------ результат - двоичное значение различной разрядности 
$&глпд | п _Буе Табе? Бе 
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$ёглид_Б1и_мог@ Табе] — мога 
$4г1п9_61и_ юг Табе? @мога 
5$фгта_п [‹®} 0 ; поле для полного результата — 
: эквивалентного двоичного представления 


соде 
1------ вводим с экрана 

ЮУ х, 0 : стандартный дескриптор — клавиатура 
том сх. Теп_$г1пд 
Теа 4х. $&г1пд :; формируем указатель на строку $%г1пд 
в ав. ; номер функции 00$ 
17 РА 
$ ех1 ; переход в случае ошибки 


гаЕнеНы преобразуем строку с десятичными числами в ее двоичный эквивалент 
я в А. - количество действительно введенных десятичных цифр. 
+----- сначала переведем в упакованное представление 


оу сх. ах 

Зи сх. 2 : корректируем счетчик цикла (чтобы 
: не учитывать 000ай. вводимые ЗИ) 

зесхх ехи ; число не было введено 

19$ $1. адг_$&глпд 

а09 $1. сх 

дес $1 ; указатель на последнюю введенную 


: десятичную цифру 
Тез 41. адг_$&г1ид_раск 
11: ЗЕ9 ; флаг 91=1 - работаем со строкой $Ёг1пд. 
; начиная с ее конца 


хог ах. ах 
10456 
апб а1. от 
$21 ах. 8 
Тоа56 
$91 а1. 4 
ада а1. ав ; в АЁ две очередные упакованные цифры 
са : флаг 91=1 — работаем со строкой ${г1пд_раск 
; с ее начала 
$6056 
$и6 сх, 2 
стр сх. 0 
39 т] 
1------ теперь преобразуем в эквивалентное двоичное представление 
Ая ; инициализируем сопроцессор 
218 $&г1пд_раск ; помещаем в стек сопроцессора 


Изёр  $гтд т : и извлекаем как целое 


Приведенная программа преобразует любое значение из диапазона 0-10'8- 1. 
Интересно отметить количественное значение максимальной двоичной величи- 
ны, соответствующее верхней границе диапазона, — это +04е056Ъ3а763 16. Оно 
пригодится нам при рассмотрении обратного преобразования для вывода на кон- 
соль — из двоичного в десятичное представление. Извлечь значение нужной раз- 
рядности можно, если ввести директивой {аЪе| соответствующие идентификаторы 
в исходный текст программы (что и сделано в нашем сегменте кода): 


$&г1пд_Б1п_Бубе Табе!  Буёе 
$г1та9_61пт_мога Табе?  могб 
$ёг1ид_БЛи_Фчог@ Табе]? Фмога 
$Ег1иа т ° 99 0 : поле для результата - 
. эквивалентного двоичного представления 
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Ввод целых десятичных чисел из диапазона О-—со 


Для преобразования десятичного числа произвольной разрядности из символьно- 
го представления в двоичное потрудиться придется несколько больше. Основа для 
этой работы была заложена в материале, посвященном арифметическим операци- 
ям для чисел произвольной разрядности. Поэтому наши действия при разработке 
программы преобразования напомнят игру с конструктором, когда из готовых ком- 
понентов будет создаваться новый продукт. 

Исходными компонентами программы преобразования десятичного числа про- 
извольной разрядности из символьного представления в двоичное будут являться 
макрокоманда умножения №-байтового числа на число размером М байтов и про- 
грамма сложения чисел размером М байтов без учета знака. Алгоритм вычисления 
двоичного эквивалента будет таким же, как рассмотренный выше, — вычисление 
полинома по схеме Горнера. Ниже приведен вариант реализующей его програм- 
мы. Расположение байтов результата — по схеме, естественной для процессоров 
и то есть младший байт находится по младшему адресу. 


р: ввод с клавиатуры числа в десятичной системе счисления 
длиной до 20 цифр. 


+= --= см. описание макрокоманд а@4 ип$19п_№_1 
: и ми] _ 1519 п_М в главе 1 


449 ип$1дп М1 тасго зиттапа_1, зиттапд_2. № 


епат 
и ип$19п_№ММ  масго ци. 1. У. 3. м 
епат 
„дата 
$Ег1и9д [6[®) 22 дир (0) : максимальное число состоит из 20 цифр 
; (22 - с учетом 090аб) 
]Леп_$г71пд = $ - Уги9 
фей 94 10 
эёглпа_б1п [61°] 10 @р (60) : максимальная длина двоичного числа — 
: 10 байтов 
Теп_$г1пд_Ь1п = $ - $г1тд_61п 
саггу [61° 0 ; перенос сложения последних байтов 
адг_$г1па_1п 94 $ёгтпа_Б1п 
$г1пд_Б1п_м [#18] Теп_$&г1п9_Бли + 1 бир (0) : результат умножения для 


: 1 40$19п_№М = Леп_$%г1п9_Б1и+1 байтов 
Теп_$&г1пд_ Бим = $ - $19 пи 
ыы гид Бим 99° УГО м 


[61°] 0 : перенос 0 < К < 255 
ь @м 1008 : размер машинного слова 
.соде 
иене вводим десятичное число С клавиатуры 
МОУ ео 0 ; стандартный дескриптор -— клавиатура 
то х. 1еп $&г1ид 
Теа г $4г7п9 ; формируем указатель на строку $Ёг1ид 
ОУ ав. зт : номер функции 005 


11 218 
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$ ех1& ; переход в случае ошибки 
+----- преобразуем строку с десятичными числами в ее двоичный эквивалент. 
: в А. — количество действительно введенных десятичных цифр 


МОУ есх. еах 
$и6 есх. 2 : корректируем счетчик цикла (чтобы 
: Не учитывать 000ав. вводимые Зи) 
1сх2 $+4 ; число не было введено 
тр $+5 
Эр ех1Е 
сопё_1: дес есх : не умножать на 10 последнюю цифру числа 
3х2 $+4 ; однозначное число 
Зпр $+5 
Этр 2 
Теа $1. $г1и9 : формируем указатель на строку $г1п9д 
хог еах. еах ; еах:=0 
т: хог ебх. ебх 
МОУ 91. [$1] 
апа 91. отн : преобразуем АЗСТТ->ВС0 


ад4 ип$19т_№_ 1 $6г7па Би 91. Теп_$%г1пд п 
----- умножаем на 10 

и] 91$19й_М№М $Ег1и9_Б1п. Теп_$г1ид_Б1и.6еп.1. $ёглпд_БАй м 
----- копируем $г1п9_Б1п_м в $ёг1пд_Б1п 


с16 
ризй $1 
ри$й сх 
14$ $1. адг_$г1пд_Бй м 
1е; 91. адг_$%г1пд_Б1п 
оу сх. Теп_$6г1и9_ Бим 
гер ПЮУ$Ь 
рор сх 
рор $1 
11 $1 
дес сх 
3схг п 
тр т] 
па: оу 1. [$1] 
апб 91. от 


аб ип$1дп_№_1 $г1пд _Б7п.91, Теп_$г1пд_Ь1п 
ВЕНЕ результат преобразования — в строке ${глид Б1и 


Одно из направлений совершенствования этой программы — динамическое 
выделение памяти для всех чисел с неизвестной длиной. Необходимо заметить, 
что способ преобразования длинных чисел универсален — его можно использо- 
вать и для значений, которые укладываются в представимые в процессоре диапа- 
ЗОНЫ ТИПОВ Данных. 


Ввод вещественных чисел 


Теперь у нас все готово для того, чтобы выполнить ввод с клавиатуры символьно- 
го представления вещественного числа и преобразование его в соответствующий 
двоичный эквивалент. В главе 17 «Архитектура и программирование сопроцессо- 
ра» учебника мы обсуждали понятие вещественного числа. Отмечалось, что веще- 
ственное число имеет две формы записи — с плавающей точкой (34.89) и научную 
(3.45е-3 = 3.45х10-°). Для преобразования вещественного числа из символьного 
представления в эквивалентное двоичное можно предложить несколько способов. 
Самый простой — использовать возможность загрузки в сопроцессор упакованно- 
го ВСО-числа. В этом случае алгоритм преобразования состоит в следующем. Сим- 
вольная строка с вещественным числом вводится в память, где она преобразуется 
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в упакованное ВСО-число. При вводе указанной символьной строки запоминает- 
ся положение плавающей точки. Полученное упакованное ВСО-число загружает- 
ся в сопроцессор, после чего оно делится на 10 в степени, соответствующей поло- 
жению плавающей точки в исходном числе. Для малых чисел (в диапазоне до 
[10'8—1]} этот способ вполне хорош. Его можно расширить, если вводить число 
в научном формате, при этом процесс перевода мантиссы аналогичен рассмотрен- 
ному выше, но при подготовке к делению на степень 10 необходимо учесть значе- 
ние степени, указанное после символа «ЕЁ». Но все равно, несмотря на расширения 
диапазона, разрядность мантиссы ограничена 18 цифрами. Устранить этот недо- 
статок можно, используя операции с числами произвольной разрядности. Этот спо- 
соб интересен своей универсальностью, поэтому уделим ему основное внимание, 

Итак, напишем программу ввода вещественного числа с клавиатуры в одном из 
двух возможных форматов — простом формате с плавающей точкой. Доработать 
программу для использования научного формата для вас не составит труда. 

В качестве знаков, разделяющих мантиссу на целую и дробную части, можно 
использовать как запятую, так и точку. Суть алгоритма преобразования состоит 
в следующем. Производится ввод с клавиатуры символов вещественного числа. 
После ввода анализируются символы буфера, куда были помещены символы вве- 
денного числа, на предмет выяснения положения плавающей точки. Обнаружен- 
ная позиция запоминается. Относительно нее введенные символы делятся на 
символы цифр целой и дробной частей. Привлекая алгоритм преобразования сим- 
вольного представления десятичного числа в двоичный эквивалент, преобразуем 
целую часть вещественного числа. Дробная часть вещественного числа также пе- 
реводится в двоичный эквивалент. Это преобразование выполняется с использо- 
ванием сопроцессора по формуле: 

((...(и Ибчи, „)/Ь +... и „Би )/Ь, 

где и, — символы десятичных цифр дробной части вещественного числа и_„и,_„... 
и и ‚6 - 10. После того как данное выражение вычислено (его результат нахо- 
дится в вершине стека сопроцессора), производится сложение результата с пре- 
образованной целой частью вещественного числа. Все, теперь в вершине стека 
сопроцессора находится вещественное число — эквивалент своего исходного сим- 
вольного представления. Текст программы преобразования вещественного числа 
из символьного представления достаточно велик и по этой причине приведен от- 
дельно, среди материалов, прилагаемых к книге (ргд06_05.азт). Заметьте, что с це- 
лью экономии места никаких проверок на правильность формата вводимого веще- 
ственного числа в программе не делается. 

Последнее замечание — об ограничениях на размерность исходного числа. Здесь 
следует различать размерности целой и дробной частей. Что касается дробной ча- 
сти, то тут вообще ограничений нет, за исключением тех, которые накладывает сам 
сопроцессор на вводимые в его регистры значения. Для целой части узкое место — 
максимальная размерность операнда в команде целочисленного сложения Е ТАБ, 
которая составляет 32 бита. 

Ввод шестнадцатеричных и двоичных чисел мы обсуждать не будем, так как 
общие принципы их ввода аналогичны рассмотренным выше для десятичных чи- 
сел. Потребность во вводе с клавиатуры шестнадцатеричных н двоичных чисел 
возникает значительно реже, чем десятичных. 
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Вывод чисел на консоль 


В этом разделе мы рассмотрим алгоритмы обратного преобразования чисел — 
из внутреннего двоичного представления в число в символьном виде, формат за- 
писи которого соответствует правилам требуемой системы счисления. Необходи- 
мо предупредить читателя, что рассмотрение обратного преобразования не будет 
симметричным прямому преобразованию. И в подтверждение этому начнем об- 
суждение проблемы вывода чисел на консоль с алгоритма преобразования шест- 
надцатеричных чисел в символьное представление. 


Вывод шестнадцатеричных чисел 


Умение работать с шестнадцатеричными числами — необходимое условие успеш- 
ного программирования на низком уровне. Шестнадцатеричные числа, по сравне- 
нию с двоичными, являются болееестественными для анализа внутреннего предста- 
вления информации в компьютере. Вспомним, что каждый байт — это совокупность 
двух тетрад, а диапазон значений, представимых одной тетрадой, как раз совпада- 
ет с диапазоном значений, которые может принимать однозначное шестнадцате- 
ричное число. Поэтому сам процесс преобразования шестнадцатеричных чисел 
в символьное представление особого труда не представляет. Например, алгоритм 
вывода на консоль содержимого одного байта состоит в выделении некоторым спо- 
собом значений его младшей и старшей тетрад и дальнейшее их преобразование 
к символьному виду. Если нужно вывести на консоль символьное представление 
более чем одного байта, то процесс выделения тетрад и их преобразования выпол- 
няется последовательно необходимое количество раз. 

В качестве полезной иллюстрации алгоритма преобразования шестнадцатерич- 
ной информации в символьное представление рассмотрим макрокоманду $НОМ, 
которая переводит содержимое одного из четырех регистров — АЕ, АН, АХ, ЕАХ в сим- 
вольное шестнадцатеричное представление. Этот макрос является универсальным 
средством, которое позволяет осуществить «подглядывание» за содержимым ре- 
гистра или области памяти динамически, во время выполнения программы. С его 
помощью можно отобразить содержимое любого из доступных регистров или об- 
ласти памяти длиной до 32 битов. Для этого достаточно лишь переслать содержи- 
мое нужного объекта (регистра или ячейки памяти) с учетом его размера в один из 
регистров — А!, АН, АХ, ЕАХ. Имя одного из этих регистров указывается затем в ка- 
честве фактического аргумента макрокоманды $НО\. Второй аргумент этого мак- 
роопределения — позиция на экране. Задавая определенные значения, мы можем 
судить о том, какая именно макрокоманда $НОМ/ сработала. Еще одна немаловаж- 
ная особенность данного макроса состоит в его возможности работать как в реаль- 
ном, так и защищенном режимах, с учетом допустимой адресации. Проверить ра- 
не данного макроопределения вы можете с помощью следующей программы. 


тис] иде а 
. Чата 
ро]е 94 ЗсаЕ436 ТП 
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.собе 
Пе ах. 110 
ЗАО а1. 0 
ЗВои ай. 160 
$Пом ах. 320 
оу еах, ро1е 


УНом еах. 480 


Ниже приведены фрагменты текста макрокоманды $НОМ. Полный текст этой 
АН имеется среди материалов, прилагаемых к книге. 


Н Вход: агд_п — имя одного из регистров АГ. АН. АХ, ЕАХ. | 
п_ро7 - номер позиции на экране, по умолчанию - 1000. | 


ЗКом масго  агд п. п_ро2:=<1000> 
1оса!  талп_рагЁ. 615р. раизе. фетрТафе. УзаеоВи# Тег 
оса! р лоде. м1. м2 
:------ переход на начало блока команд во избежание выполнения данных 
Зтр тали_рагё 
;------ некоторые константы и переменные 


1------ начало блока команд 
сохранение в стеке используемых регистров: 
: ЕАХ, ЕВХ, ЕСХ, ЕСХ, ЕОТ, 05, ЕЗ 
та1и_ ра: : 


рии с5 
рор 9$ 
Теа Ьх. с$:бетрТате : в Бх - адрес таблицы-шаблона (для х1аЁ) 
хог сх. сх ; очистка сх 
ЕЕ Е начало блока определения того. 
: какой регистр был передан макросу 
ТЕТОМТ <а1>. <вагд п> ; если аргумент=а] или Ас. 
?гедвь1Е = ТВИЕ ; установка флага 8-битового регистра 
оу ап, а1 
ЕМУ 
уе ---- передан не а] или АЁ 
ТЕТОМ <аН>. <вага_п> : если аргумент=аН или АН. 
?гедвы® = ТВИЕ : установка флага 8-битового регистра 
ЕМОТЕ 
1------ передан не АН или аН 
ТЕТОМ <ах>. <вагд_п> ; если аргумент равен ах или АХ. 
?ге916Ь1Е = ТКИЕ : установка флага 16-битового регистра 
ЕМОТЕ 
== -- передан не ав. АН „ах или АХ 
1--*--- обработка содержимого аа. АЕ. АН. АХ. ЕАХ 
ТЕ (?гед8б1®) если передан а! или ай 
рип еах 
апа ан. отв : обращение к старшей четверке битов аН 
эйг ах. 12 : сдвиг битов в начало (16 - 4 = 12) 
х1аф ; трансляция по таблице-шаблону 
14----= ео символа из а1 в еб 
мост. 
$81 а» 8 
тис сх 
рор еах 
апв ах, ОтООн ; обращение к младшей тетраде ав 
эНг ах. В ; сдвиг битов в начало (16 - (4+4) = 8) 


хТае : трансляция по таблице-шаблону 
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ог 91. ах : помещение очередного символа в ОТ 
$91 ед. 16 
тис сх 
ЕМОТЕ 
ТЕ (2?ге9161%) ; если передан ах или ах 
а начало обработки значения регистра АХ 
ризВ еах 
ян обращение к старшей четверке битов ах 
апа ах. 01000н 
$Нг ах. 12 ; сдвиг битов в начало (16 - 4 = 12) 
ха : трансляция по таблице-шаблону 
1------ помещение символа из а] в старшую тетраду 
; старшей половины ЕО 
Де)” 91. ах 
$1 еб1. 8 
тис сх 
рор еах 
ри$в еах 
аенаы обращение ко второй четверке битов ах 
апа ах. 01008 
Зиг ах. 8 ; сдвиг битов в начало (16 - (4+4) = В) 
хТаё ; трансляция по таблице-шаблону 
14----- помещение очередного символа в младшую тетраду 
| старшей половины ЕОТ 
ог 1. ах 
$91 еб. В 
тис сх 
рор еах 
ри$Н еах 
НяъеыЕ обращение к страшей четверке битов в АЁ 
апа ах. О+08 
5ИГ ах. 4 ; сдвиг битов в начало 
: (16 - (4+4+4) = 4) 
х1аф ; Трансляция по таблице-шаблону 
ог 91. ах : помещение очередного символа в ЕОТ 
$11 едт. 8 
тис сх 
рор еах 
НЕаване обращение к младшей четверке битов АХ 
апб ах. 0 
х1ае ; трансляция по таблице-шаблону 
ог 41. ах ; помещение очередного символа в Е01 
тис сх 
ЕМОТЕ 
Е (?гедзёьль) ; если передан ЕАХ или ЕАХ 
ааа ; аналогично АХ 
ЕМОТЕ 
1------ вывод на экран результата с учетом режима работы процессора 
: результат - в паре ЕОХ:ЕВХ. количество цифр -— в СХ 
+----- восстановление регистров 
ЕМОМ 


Вывод целых десятичных чисел из диапазона 0-99 


Выше упоминалось, что для значений из диапазона 0-99 взаимное преобразова- 
ние между символьной десятичной и двоичной формами может производиться 
командами умножения и деления двоично-десятичных (ВСО-чисел) — ААМиААО. 


| Программа: рг906_07.а$т. Ввод с консоли десятичного числа из диапазона | 
0-99 и обратный его вывод на консоль. 
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Бит 0аБ $егис 

Теп_БиР [6 3 : длина Быт бай 

Тел _1и [6 0 ; действительная длина введенного слова 
: (без учета бан) 

БР п 6 3 ар (20и) : буфер для ввода (с учетом 00и) 

еп 

„Вата 

Шт Биг бай <=> 

адг_ Бит 96 БиР 

соде 


+= --- вводим 2 символа с клавиатуры. 

: контроль на допустимые значения не делаем 
16$ 9х. адг_ Бит 
в ап, бан 


пя 218 

хог ан. ав 

стр Биг. 1еп_лп. 2 ; сколько чисел введено реально? 
зле т 


оу ап. Бит.Биг п 
ет -- преобразование в неупакованное десятичное представление 


т: оу а1. Би. Бит _1п+1 
айа ах. ОтОИ 
аав : в АЁ двоичный эквивалент исходного 


: двузначного десятичного значения 
+++ вывод на консоль содержимого АЁ 


аат 

пом Чх.ах 

ог дх. 030308 

го] 9х. В : выводим старшую цифру 
ОУ ан. 2 

ТиЕ 21 

го] 9х, В : выводим младшую цифру 


116 21и 


Для преобразования с целью последующего вывода на консоль больших дво- 
ичных значений можно использовать два способа: путем деления по модулю 10 
(диапазон значений не ограничен) и с помощью сопроцессора (0..10' - 1). 


Вывод целых десятичных чисел из диапазона О-—со 


В основе алгоритма вывода двоичных значений из диапазона 0—° лежит положе- 
ние о том, что цифры (...0,0,0,) десятичного представления, начиная с младшей, 
получаются последовательным делением исходного двоичного значения и на 10: 
0, - и тоа 10; И, = [м/10.] под 10; 0, = Ши/10.] /10.] по 10 ит. д., до тех пор пока 
после очередного деления делимое не окажется равным нулю: [...Ши/10/10.)..]= 0. 
Здесь символы |. и ] обозначают целую часть частного, округленного в меньшую 
сторону. 

Почему в отличие от алгоритмов ввода с консоли для обратного преобразова- 
ния нет такого разнообразия способов? Это объясняется особенностью команды 
ОТ\ процессора, которая используется в описанном выше алгоритме для получе- 
ния частного и остатка. Ее требование к соотношению значений делимого и дели- 
теля — размер частного должен быть в два раза меньше делимого. В противном 
случае возникает исключение #0Е (ошибка деления), и программа аварийно завер- 


шается. 
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Исходя из этих условий, нам ничего не остается, кроме как воспользоваться 
программой беззнакового деления значения размером М байтов на значение раз- 
мером 1 байт. Она была рассмотрена в главе 1, посвященной целочисленным ариф- 
метическим операциям. Для удобства эту программу мы оформим в виде макроко- 
манды. 


:| Вход: Б1п_@@ - многобайтовое двоичное число | 
:| для преобразования в области памяти. | 


ЕЕ Ч1\ ип$19п_М_1_Т — макрокоманда деления М-разрядного 
беээнакового целого на одноразрядное число размером 1 байт 
(порядок следования байтов — младший байт по младшему адресу 
(1ифе1)). См. главу 1 и материалы. прилагаемые к книге 

у _ипб1дп_ мт „пасго и, М м. м. г 


епдт 
„Чата 
$1г1пд [1 °) 10 дир (0) : пусть максимальное десятичное число 
; состоит из 10 цифр 
1Теп_51г1пд = $ - $1119 
аЧг_$г1пд [ее $1г1п9 
Б1п_94 Табе? Бе 
94 ОРРЕРЕЕЕТИ 
Теп_Ь1п_д4 = $-61п_д4 
еп [) 10 
гетатпаег м 0 
.соде 
------ значение для преобразования должно быть в памяти 
1е5 41. а@г_$1г1п9 ; строка с десятичными символами 
с14 : обработка в прямом направлении 
сот тие: 
Чу _ип$19п_№_1_Т Ылп_94. Теп Ьп_94, еп. Б1п_@4. гета1пдег 
том ах. гета1паег 
ог а1. з0п ; преобразуем в символьное представление 
$056 : сохраняем в $Фг1пд 
: очередную десятичную цифру 
тис сх : подсчитываем количество цифр 
стр п 94. 0 
зле сот 1пие 
1------ вывод на консоль с конца строки 
ме ап. 
фа 
ме $1. 91 
Чес $1 
т]: То@$6 
оу 91. а1 
1 21п 
Тоор м] 


В данной программе преобразованию подвергается значение в памяти. Причем 
мы в качестве исходного двоичного значения задали максимально возможное 
беззнаковое число размером в двойное слово. Результат преобразования — 
4 294 967 295, что полностью согласуется сожидаемым десятичным значением. Но 
задавать исходные значения в памяти не всегда удобно, хотелось бы, чтобы можно 


пы. 
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было подвергать преобразованию значения прямо из регистров процессора. Для 
такого типа преобразований (значений в регистрах процессора) лучше подойдет 
способ с использованием сопроцессора. Рассмотрим его. 


Вывод целых десятичных чисел из диапазона 
0-—999 999 999 999 999 999 


Этот способ вывода основан на возможности сопроцессора работать с упакован- 
ными десятичными числами. Выше мы уже рассматривали преобразование деся- 
тичных чисел в двоичное представление на основе этой возможности. Система 
команд сопроцессора содержит команду ЕВ$ТР, которая сохраняет десятичное чис- 
ло из вершины стека сопроцессора в области памяти с одновременным преобразо- 
ванием этого числа в формат десятичного числа. Область памяти, в которую про- 
исходит сохранение, должна быть описана директивой ОТ. Важно отметить, что 
команда Е.О, с помощью которой вы будете помещать целое число в сопроцессор 
для дальнейшего преобразования, трактует целые числа как числа со знаком. По- 
зтому попытка задать целое число в виде ОН (с единичным старшим разрядом 
операнда) приведет к тому, что в стек сопроцессора будет помещено значение —1 
со всеми вытекающими отсюда последствиями для результата преобразования. 


Программа: ргд06 09.а$т. Вывод целого десятичного числа | 
из диапазона 0-999 999 999 999 999 999 на экран. | 


++ -----= + 
| Вход: выводимое значение — в поле $фг1лпа Б1п_@мога | 
ен + 
| Выход: вывод десятичного числа на экран ] 
ен -- + 
„Чата 


------ поле ${г1пд_61п_@мога содержит выводимое значение — с помощью 

Е идентификаторов. вводимых директивой Табе]. это значение может 

Е трактоваться как значение различной разрядности 
$4г1т9_61п БуЕ Табе? Бе 
5фг1пд `Ь1т иога Табе!  мога 
$ёг1пд Б1п ога Табе] дмога 
$г1пд Б1п Чмог@ 94 Оае0Б6ЬЗа76ЗЕРРИ :; зададим максимально возможное для 

: сопроцессора двоичное целое со знаком 

:8 ${г1ид_раск исходное значение из $фг1пд_Б1п_Фмог@ в упакованном десятичном формате 


$г1и9_раск [ея 0 
Теп_$&глпд_раск = $ - $г1пд_раск 
адг_$фг1пд_раск аа $ег1ид_раск 
$г1п9 [61 20 ар (0) : максимальный результат состоит 


: из 18 десятичных цифр 
Теп_5{г1пд = $ - $г19 


адг_$г1п9 [| $%г1п9д 
.соде 
----- преобразуем Б1п->4ес 
я 
17714 $г1тд_Б1п_дмога —:; заносим в сопронессор 
: двоичное целое число 
Ю$р {гта раск : извлекаем упакованное десятичное 
----- распакуем в цикле 
145 а адг_$фг1пд_раск 
а94 . Теп $%г1па_раск - 2; на конец $5глпа_раск 


: (18 упакованных десятичных цифр} 
Тез 41. ааг_$1г1пд 
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Не сх. 9 ; 9 пар упакованных десятичных цифр 
СуСТ: хог ах. ах 

$84 ; $фгтид_раск обрабатываем с конца 

10956 ; в а1 очередные 2 упакованные 


: десятичные цифры 
:------ распаковываем — ап = младшая. а\ = старшая 


$] ах. 4 
го] а1. 4 
ог ах. 30301 : преобразуем в символьное представление 
хСП9 ап. а1 ; ай = младшая. а1 = старшая 
с14 ; В ${г1т9 записываем с начала 
$60$м 
10ор — сус1 
4----- выводим на консоль 
оу Ьх, 1 ; стандартный дескриптор — экран 
оу сх. Теп_${г1пд 
145 4х. а@г_5%г1т9 : формируем указатель на строку $1г1пд 
ПОМ ай. 40н : номер функции 005 
116 2н 
3 ех1& ; переход в случае ошибки 


Вывод вещественных чисел 


Последний алгоритм, который мы рассмотрим в этом разделе, — преобразование 
вещественного значения в вид, пригодный для его отображения на экране консо- 
ли. Ниже приведены только те фрагменты программы, которые относятся непо- 
средственно к преобразованию. Полный текст программы находится среди мате- 
ВИО: прилагаемых к книге. 


:| Обязательно наличие в программе процедур: | 
:| геа@ сигзог_ роз Лот. 5е® сигзог_роз11оп. | 


ее + 

. дата 

дес_1п_тапЁ32 6 0 : мантисса в двоично-десятичном 
; представлении 

дес_Ь1п паг3З2 % 0 ; характеристика в двоично-десятичном 
: представлении 

сиг [ее 0 : переменная для сохранения состояния 
; регистра слова состояния 

Тел 9“ 10 ; константа 

Поа%32 94 .234567Ве12 : значение вещественного числа размером в 32 бита 
: для вывода 

мапёЗ2 94 0 : мантисса в двоичном представлении 

Ваг3З2 94 0 ; характеристика — вещественный формат 
; в двоичном представлении 

11% _паг32 94 0 : характеристика — целое 
: в двоичном представлении 

питбег [6 0 

спаг [9 0 

сиг5ог_со1ити 96 0 

сигзог_11пте [6 0 

питрег_оГ 419115 4 9 

ад [61] 0 

.соде 


а процедура сдвига курсора на одну позицию вправо 


Вывод чисел на консоль 


пехё_сигзог_со1ити ргос 


пехф_сигзог_софитп епар 
:------ процедура позиционирования курсора 
зе _сигзог _ро$110п ргос 


Зее _сигзог_роз1оп `епар 
------ процедура определения текущей позиции курсора 
геаа | СигОГ _роз оп ргос 


геад \ Сиг5ОГ _роз1 топ епар 
------ процедура вывода символа с учетом цвета 
рг1и_ спаг ргос 


рглиф_спаг епар 
:------ выделение мантиссы из короткого формата (32 бита) 
и ее преобразование в двоично-десятичный формат 
Е (для положительной характеристики (результат в $1(0)) 
ро$1{1уе_ паг ргос 


НТ фе 
$6 11% _ПагЗё. 6 
Та ри: Ну Фет 


стр 19 вагЗ2. 0 
дес 1 _Паг32 
33 За рп 
геё 
ро$1{1уе_Наг епар 
;------ выделение мантиссы из короткого формата (32 бита) 
} и ее преобразование в двоично-десятичный формат 
: (для отрицательной характеристики результат в $1(0)) 
педат1уе_паг ргос 


Пу фе 
5и6 Т_вагЗё. 7 
Та рп: Рути]  Теп 


стр 16 Паг3З2. 0 
11с 11% _Паг32 
л Таб пп 


педа{1уе паг еп 
1------ вывод вещественного числа (32 бита) в десятичном виде 


ФргтиЕЗё ргос 
ризНа 
;----- установка размера мантиссы в 24 бита 
Ни 
С5си  сыг 


апа сиг. 11110000111111116 
ог сиг. 11110000111111116 


Па сиг 
{14 оа{32 ; загрузка 32-битного числа в стек 
ФхёгасЕ ; выделение мантиссы ($10) 
; и характеристики ($11) 

15{р  мапёЗё : запоминаем мантиссу 
#15 Ваг32 :; запоминаем характеристику 

------ перевод двоичной характеристики в десятичную характеристику 
{19192 : загрузка десятичного логарифма 2 
Нити  ПагЗ2 ; умножение двоичной харакеристики на 10910(2) 
фепатпе ; округление 
11$р т рагз2 ; сохранение десятичной характеристики 


2114 МЕ вагЗ2 
6$р дес п ПагЗ2 : сохранение двоично-десятичного 
значения характеристики 
------ выбор процедуры по выделению мантиссы 
йа Йоа{32 
стр Ваг32. 0 
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216 Глава 6. Преобразование чисел 


са$е1: 


епд_сазе: 


гего: 


39е сазе] 
са] 1 педа1уе_паг ; преобразования мантиссы. 
; еСли характеристика отрицательная 
3тр епа сазе 
са11ро$141ме_раг : преобразование мантиссы. 


; если характеристика положительная 


16${р  4ес_Ь1п тапёЗё ; сохранение двоично-десятичного 


; представления мантиссы 


вывод на экран вещественного числа 


Теа $1. дес_Ь1т тапё32 
ааа $1. 9 

Ще а1. [$1] 

вывод знака числа 

Те5% а1. а! 

2 гего 

[80 спаг. "-” 

са1] рг?пё_спаг 

са11 пехё_сигзог_ со ит 


данный фрагмент пропускает байты с нулевым содержимым 
до первого байта со значащей цифрой 


дес $1 

дес пипбег_оР_ 619115 

ОУ а1. [$1] 

Те$+ а1, а1 

Ка 11г$ф_2его ; найден первый ненулевой байт 

З7р 2его ; байт имеет нулевое значение — 
: продолжаем поиск 

просмотр тетрад первого найденного ненулевого байта 

апа а1, 111100006 

Те$е а1. а1 

де $есопа_ 4191 : если старший полубайт байта равен нулю. 
; начинаем вывод со второго байта 

Зпр ге 91916 : если старший полубайт байта не равен нулю. 
; начинаем вывод первого байта 

начало цикла вывода мантиссы 

дес $1 

дес питбег_оф_919145$ ; индекс выводимого байта 

ОУ а1. [$1] 

вывод первого полубайта. содержащего цифру 

апа а1. 111100006 

эИг а1. 4 

ада а1. 30' 

оу сНаг, а1 

са1] рг7иЁ_спаг 

са11 пехф_сигзог_соТит 

если выводимая цифра первая. то выводим после нее точку 

стр Пад. 0 

пе зесопа_ 41914 

мо спаг, "." 

са11  рг1пё сваг 

са11 пех сигзог_соТити 

1ис Пад 

вывод второго полубайта. содержащего цифру 

Ще а1. [$1] 

апа а1. 000011116 

ааа а1. ЗОВ 

оу спаг, а! 

са11 ргфиё снаг 

са11 пехф_сигзог_соТитй 

если выводимая цифра первая. то выводим после нее точку 

стр Яад. 0 

3пе поп г$Е 91911 

ЮУ сНаг. ".” 

са11 ргтпе_сваг 





ПОПЕ г $ 


бое: 


рглиё_паг: 


{ргти 632 
ма] п 


Вывод чисел на консоль 


са11 пехе_сиг5ог_соТити 
1йС ад 

стр питрег от 419145. 0 
зе речи 919115 

ЮУ Тад. 0 

вывод характеристики числа 
оу саг. "Е 

са11 рг1пё_спаг 

са11 пех{_сигзог_соТити 
Теа $1. Чес_Ь1п паг32 
вывод знака числа 


ада 51. 9 
ОУ а!. [$1] 
Се а1. а] 

де ргли_паг 
ме саг. "-" 


са11 рг1иё_спаг 

са11 пехё_сигзог_соТитп 
значения характеристики 

5и6 $1. 9 

оу а1. [$1] 

вывод первой цифры характеристики 
апа а]. 111100006 


$Иг а1. 4 
ада а1. 300 
ту саг. а] 


са11 рии _сваг 
са11 пех сигог_соТитй 
вывод второй цифры характеристики 


ОУ а1. [$1 
апа а1. 000011116 
ада а1, зой 
ме спаг, а] 


са11 рг1и®_спаг 

са11 пехё_сигзог_соити 
том Паб. 0 

рора 

ге 

еп 

ргос 


са11 1рг1иё32 
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Глава 7 


Работа с файлами 
в программах на ассемблере 


Очевидно, целесообразно рассматривать прикладную систему как 
некоторую совокупность данных и операций, определенных на этих дан- 
ных, а не просто как набор программ, взаимодействующих между собой 
посредством обмена данными. Программы — это всего лишь рабочие 
инструменты, в то время как данные — это своего рода исходное сырье, 
из которого вырабатывается конечный продукт. 

Набор данных вне среды, приспособленной для его использования, 
не представляет никакой ценности, однако в рамках такой среды имен- 
но набор данных приобретает основное значение. 


Динар Нурмухамедович Бибишев 


Язык ассемблера не содержит средств для работы с файлами. Если такая необхо- 
димость возникает, то программа должна включать в себя фрагменты кода, в кото- 
рых производится обращение к средствам операционной системы, осуществляю- 
щим взаимодействие с файловой системой. Это лишний раз подтверждает тот факт, 
что в области контактов с внешним миром программа на ассемблере оказывается 
привязанной как к конкретной аппаратной, так и к конкретной операционной плат- 
формам. В сегодняшней ситуации программисту все еще приходится сталкивать- 
ся с необходимостью программирования для М5 ОО5. Поэтому изучение средств 
для работы с файлами этой операционной платформы не потеряло своей актуаль- 
ности и эти средства в плане совместимости поддерживаются различными реали- 
зациями \/тдо\. В редакции М$ ОО$ 7.0 введена поддержка длинных имен фай- 
лов, используемых системой файлового ввода-вывода \/т32. Таким образом, 
можно выделить четыре аспекта работы с файлами из программ на ассемблере: 


работа с системой файлового ввода-вывода М$ ОО$, использующей короткие 
имена (по схеме «8.3»>); 

работа с системой файлового ввода-вывода М$ ОО$, расширенной длинными 
именами (длиной до 255 символов); 

работа с системой файлового ввода-вывода \/т32; 

использование файлов особого вида, поддерживаемых \/ 132, — проецирован- 
ных на память. 
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Цель данной главы — предоставление читателю фрагментов кода, реализую- 
щих наиболее часто востребуемые на практике файловые операции для различ- 
ных операционных платформ. Соответственно, нам не обойтись без определенной 
систематизации, но это будет сделано лишь для того, чтобы создать у читателя 
общее представление о поднятом вопросе. Если у вас впоследствии возникнет по- 
требность в реализации файловых функций, чье полное практическое описание 
отсутствует в материале данной главы, то более подробные сведения о них можно 
будет найти в других справочных руководствах, например библиотеке МОМ. Да- 
лее, опираясь наобщие принципы организации ввода-вывода, рассмотренные ниже, 
вы сможете без труда решить неожиданную проблему. Материалы всех разделов 
подобраны так, чтобы читатель мог познакомиться с общими принципами органи- 
зации ввода-вывода в каждом случае, начиная от самых простых. | 


Работа с файлами в М$ 00$ (имена 8.3) 


В основе файловой системы М$ ОО$ лежит древовидная структура каталогов. 
Корень этой структуры представляет собой совокупность ограниченного числа 
дескрипторов, описывающих файлы и каталоги (подкаталоги) следующего уров- 
ня. Подкаталог представляет собой структуру особого типа, которая содержит де- 
скрипторы файлов и подкаталогов очередного нижележащего уровня. В отличие 
от корневого каталога, количество дескрипторов в подкаталоге не ограничено и 
определяется только размером диска. Дескриптор представляет собой экземпляр 
структуры размером 32 байта. Поля этой структуры содержат различную инфор- 
мацию о файле: идентификатор файла и его характеристики — дату и время созда- 
ния (модификации), номер начального кластера, длину файла и его атрибуты. 
Использование файла в программе основывается на следующих операциях: 


" создание нового файла; 

открытие существующего файла; 

запись/чтение в/из файл(а); 
® закрытие файла. 

Операционная система М$ ОО$ поддерживает эти операции с помощью набо- 
ра функций прерывания 211. Кроме них, данное прерывание содержит функции 
для работы с каталогами: 
® создать каталог; 

* удалить каталог; 
* сменить каталог. 


Существует также ряд других функций для работы с файловой системой, в том 
числе для поиска файлов и получения информации о них. 


Создание, открытие, закрытие и удаление файла 


Прежде чем использовать файл в программе, его необходимо открыть с помощью 
функции ЗаН прерывания 211. Если файл не существует, то перед открытнем его 
нужно создать. Оба эти действия выполняются одной из следующих функций: ЗП, 
5ЬН, Бай, 6сН. 
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Создание файла с усечением существующего 
до нулевой длины 
Вход: АН = ЗСН; СХ = атрибуты файла (значения битов: 0 = 1 — только чтение; 1 = 1 — 
скрытый файл; 2 = 1 — системный файл; 3 = 0 — игнорируется; 4 = 0 — зарезерви- 
рован (каталог), должен быть равен 0; 5 — бит архивации; 6 = 0 - резерв; 7 = 1 — 
общий файл в системе МоуеЙ Ме\/аге; 8—15 = 0 — резерв); 05:0Х — АЗСП7-имя 
файла. 

Выход: СЕ = 0 — АХ = дескриптор файла; СЕ = 1 — АХ = код ошибки (3 — нет тако- 
го пути; 4 — нет свободного дескриптора файла; 5 — отказ в доступе). 


: Программа: ргд07_01.а5т. Создание в текущем каталоге функцией Зсп ] 
файла му_ЕПе. же. | 


П 
еее еее нес + 
„Фата 
Нап1е [ем 0 ; дескриптор файла 
11] епате [‘ ‘ту РТе.1хе’. 0 
роте Гпате [6 Тепате 
.соде 

хог сх. сх : атрибуты файла — обычный файл 
14$ 4х. ро1п_Тпате ; формируем указатель на имя файла 
ОУ ав. Зсп : номер функции 00$ 
1 211 : создаем файл 
4 ех{ : переход в случае ошибки 

аченеа действия при успешном создании файла 
моу Нап Те. ах : сохраним дескриптор файла 


Функция ЗсП обладает особенностью, заключающейся втом, что если файл уже 
существует, то он открывается с нулевой длиной, при этом его прежнее содержи- 
мое теряется. Это неудобно. Чтобы предотвратить эффект очистки содержимого, 
для открытия файла можно использовать функцию 56! или более современную 
функцию 6сп. 


Открытие существующего файла 


Когда файл создан, его можно открыть функцией ЗаН. При этом необходимо ука- 
зать режим доступа к файлу. 

Вход: АН = З@Н; АЁ = режимы доступа и разделения — определяются состоянием 
битов: 2 — 0 — режимы доступа (000 — только чтение; 001 — только запись; 010 — 
чтение/запись)); 3 — зарезервирован (0); 4—6 — режим совместного использования 
(000 — режим совместимости; 001 — запрет чтения и записи другими програм- 
мами; 010 — блокировка записи другими программами; 011 — запрет чтения 
другими программами; 100 — разрешение полного доступа другим програм- 
мам; 111 — сетевой ЕСВ (доступен только в течение серверного вызова)); 7 — 
наследование (если установлен, то файл принадлежит только текущему про- 
цессу и не наследуется дочерними процессами); 05:0Х — адрес АЗСИЙ-цепоч- 
ки с именем файла. 

Выход: СР = 0 — АХ = дескриптор файла; СЕ = 1 — АХ = код ошибки: 3 — нет тако- 
го пути; 4 — нет свободного дескриптора файла; 5 — доступ отказан; 126 — недей- 
ствительный код доступа. 
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Функция З@Н возвращает дескриптор файла, указатель в файле устанавливает- 
ся на начало файла. 


- Программа: рг907_02.азт. Открытие существующего файла ту_Р11е.+х% | 
Е в текущем каталоге функцией Зап файла. 1 


ы 
пене + 
„дата 
вап] е [6 0 : дескриптор файла 
{1 ]епате [66] 'Пу_Р11е. хе". 0 
ро1пё_Рпате 99 Т11епате 
.соде 
ОУ 02и ; реним доступа 
145 о роти_Гпате ; формируем указатель на имя файла 
ОУ ав. зай ; номер функции 005 
11% 21й : открываем файл 
с ех1+ ; переход в случае ошибки 
:------ действия при успешном открытии файла 


ЮУ Напо]е. ах ; сохраним дескриптор файла 


Создание нового файла с сохранением существующего 


Еще одна функция создания файла 5, в отличие от функции ЗС, позволяет про- 
вести процесс открытия файла более мягко — без ущерба прежнему содержимому. 

Вход: АН = 5ЬВ; СХ = атрибуты файла; 05:0Х — АЗСИ7-имя файла. 

Выход: СЕ = 0 — АХ = дескриптор файла; СЕ = 1 — АХ = код ошибки: 3 — нет тако- 
го пути; 4 — нет свободного дескриптора файла; 5 — отказ в доступе; 50| — файл 
существует. 

Если указанный файл существует, то функция 5Ь1 завершается с кодом ошиб- 
ки 50Н (СЕ = 1). Поэтому после вызова данной функции необходимо анализиро- 
вать флаг СЕ (командой 3С или 3№), если СЕ = 1, то для открытия файла необходимо 
дополнительно вызвать функцию ЗОН. 


Программа: ргд07_03.азт. Создание нового файла с сохранением | 
существующего в текущем каталоге функцией 561. Г 


не + 
.дафа 
вапфТе Чи 0 ; дескриптор файла 
РТ епате Ч ‘пу Ре. хе’. 0 
ро1иЕ_Тпате 94 1Тепате 
.соде 
хог сх. сх ; атрибуты файла — обычный файл 
145 9х, ро1пё_Гпате : формируем указатель на имя файла 
оу ай, 56И : номер функции 005 
11% 21 : открываем файл 
пс м] : обойдем открытие файла 
ОМ а1, 020 : режим доступа 
оу ап. зай ; номер функции 00$ 
17% 21 : открываем файл 
3с ех1{ : переход в случае ошибки 


1------ действия при успешном открытии файла 
т: оу НапбТе. ах ; сохраним дескриптор файла 
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Открытие или создание файла с расширенными 
возможностями 


Функция 6сН появилась в последних версиях М5 ОО$ (2О5$ 4.0+). С ее появлени- 
ем устраняется необходимость отслеживать существование создаваемого файла. 
Для корректной работы достаточно задать нужные значения в соответствующих 
регистрах. Анализ возможных значений показывает, что данная функция факти- 
чески заменяет существовавшие до этого функции создания и открытия файлов. 

Вход: АХ = 6С00Н; ВЕ = флаги — режим открытия (значения битов: 7 — наследо- 
вание; 4—6 — режим разделения; 3 — резерв (0); 0-2 — режим доступа); ВН = флаги 
(значения битов: 6 = 0 — использовать стандартную для М ОО$ буферизацию; 
6 = 1 — отменить стандартную для М$ РО$ буферизацию; 5 = 0 — использовать 
обычный обработчик ошибок (1пё 248); 5 = 1 — не использовать обычный обработ- 
чик ошибок (1пё 241), для выяснения причины ошибки вызвать функцию 598 
211); СХ = атрибуты создаваемого (и только) файла; 01 = действия, если файл су- 
ществует или не существует (значения битов: 0-3 — действие, если файл суще- 
ствует (0000 — вернуть ошибку; 0001 — открыть файл; 0002 — открыть файл без 
сохранения существующего); 4—7 — действие, если файл не существует (0000 — 
вернуть ошибку; 0001 — открыть файл; 0002 — создать и открыть файл); ОН = 008 — 
резерв; 0$:$1 — адрес строки с АЗСП7-именем файла. 

Выход: СЕ = 0 — успешное выполнение функции: АХ = дескриптор файла, СХ = 
= состояние (0 — файл открыт; 1 — файл создан и открыт; 2 — файл открыт без 
сохранения содержимого существующего файла); СЕ = 1 — АХ = код ошибки. 

Следующий фрагмент программы показывает вариант применения функции 
бен. 


= Программа: рг907_04.азт. Демонстрация открытия или создания файла 
с расширенными возможностями в текущем каталоге функцией 6Сп. | 


: 
еее ------ + 
„дата 
пап? е Ом 0 : дескриптор файла 
{11 епате [6] ') 'ту ГПе. хе". 0 
ро1п®_Тпате 99 1Тепате 
.соде 

хог. сх. сх : атрибуты файла — обычный файл 
ОУ Ьх. 2 : режим доступа обычный — 


; доступ для чтения-записи 
РАЯ если файл существует. то открыть его. в противном случае 
вернуть ошибку (для эксперимента) 


ОУ Чт 

1495 $1. ро1пё Гпате : формируем указатель на имя файла 
ОУ ав. 6сн : номер функции 00$ 

Я 211 : открываем файл 

)пс МЕ ; если файл существовал. то переход 
ЮУ 9х. 108 ; открыть файл 

оу ап. 6сп : номер функции 00$ 

я 2 ; открываем файл 

с ех1& ; переход в случае ошибки 


р ЕЕ Я действия при успешном открытии файла 
т: Пе" ВапдТе. ах : сохраним дескриптор файла 
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Закрытие файла 


В конце работы с файлом его нужно закрыть. Но это действие не является обяза- 
тельным, так как функция 4сЙ, которая завершает выполнение программы, в числе 
прочих действий выполняет и закрытие всех файлов. 

Вход: АН = Зен; ВХ = дескриптор файла, полученный при его открытии. 

Выход: СЕ = 0 — АХ = не определен; СЕ = 1 — АХ = код ошибки: 6 — недопустимый 
дескриптор. 

Во время закрытия файла выполняются все незаконченные операции записи 
на диск в элементе каталога, соответствующего файлу, модифицируются различ- 
ные поля, в том числе поля времени и даты устанавливаются в текущее время. 


а 
Вапд1е [ем 0 : дескриптор файла 
Я Тепате [ет "ту ТПе.5хё". 0 
ротпе_Тпате 99 ТП епате 
.соде 
а открываем файл 
хог сх. сх : атрибуты файла - обычный файл 
195 9х. роли Тпате : формируем указатель на имя файла 
ЮУ ап. 550 : номер функции 00$ 
ти 2 
дис ЩИ : обойдем открытие файла 
ОУ а1. 028 ; режим доступа 
оу ав. зай : номер функции 00$ 
Те 21 : открываем файл 
3 ех{ : переход в случае ошибки 
:------ действия при успешном открытии файла 
м: оу ВапЧ]е. ах : сохраним дескриптор файла 
------ закрываем файл 
м2: ОУ ав. Зеп 
ПУ Ьх, Папе 
ТЕ 21 
пс ех1* ; переход. если нет ошибки 
1------ обработка ошибки 
тр м2 : повторяем операцию закрытия 
Удаление файла 


При необходимости файл может быть удален функцией 411. 
Вход: АН = 418; 05:0Х — АЗСП7-имя файла (в последних версиях М$ ОО мож- 
но использовать символы группирования * и ?); ({ = атрибуты удаляемого файла. 
Выход: СЕ = 0 — АХ = не определен; СЕ = 1 — АХ = код ошибки: 2 — файл не най- 
ден; 3 — нет такого пути; 5 — в доступе отказано. 


а 
ВапдТе Чи 0 : дескриптор файла 
+1 Тепате [1 ‘пу Пе. хе”. 0 


ротиё Тпате 99 ТИ епате 
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„.сове 
НЕЕ открываем файл 
хог сх. сх : атрибуты файла — обычный файл 
195 9х. ро1пё_Рпате ; формируем указатель на имя файла 
ОУ ан. 561 : номер функиии 005 
176 2 
дис т ; обойдем открытие файла 
ОУ а1. 020 ; режим доступа 
ОУ ак. зав : номер функции 005 
ия 2 : открываем файл 
6 пз : переход в случае ошибки 
1------ действия при успешном открытии файла 
м: ЮУ папд1е, ах : сохраним дескриптор файла 
== =255 закрываем файл 
м2: ОУ ав. Зе 
ОУ Ьх, Папе 
17% 211 
дис ех1ф : переход. если нет ошибки 
Е обработка ошибки 
Этр 2 : повторяем операцию закрытия 
:------ удаляем файл 
ех1Ё: ОУ ап. 41И 
195 9х. ро1пё Тпате ; формируем указатель на имя файла 
хог сх. сх : атрибуты файла 
Тиё 2н 
пс тЗ : переход. если нет ошибки 
1------ обработка ошибки 
м ех1 : повторяем операцию удаления 
3: т ; выход из программы 


Функция дан не позволяет удалять файлы с атрибутом «только для чтения». 
В этом случае необходимо изменить атрибуты удаляемого файла с помощью Ффун- 
кции 4ЗН. 


Создание временного файла 


Вход: АН = 5АВ; СХ = атрибуты файла; 05:0Х — указатель на АЗСП7-строку с путем, 
заканчивающимся символом \ и 13 дополнительными нулевыми байтами, кото- 
рые в результате вызова функции будут заполнены символами сгенерированного 
имени. 

Выход: СЕ = 0 — АХ = дескриптор файла, открытого для чтения/записи в режиме 
совместимости; 05:0Х — путь кфайлу, дополненный сгенерированным именем вре- 
менного файла; СЕ = 1 — АХ = код ошибки: 3 — нет такого пути; 4 — нет свободного 
дескриптора файла; 5 — в доступе отказано; 506 — файл существует. 

В результате вызова функции 5АН создается файл с уникальным именем, кото- 
рый после своего закрытия должен быть явно удален создавшей его программой. 
Закрытие файла производится функцией ЗЕН. 


4 --- + 
:| Программа: рг907_07.азт. Создание временного файла функцией 5ап. | 
еее ----- + 
даа 
Вапд1е 9“ 0 : дескриптор файла 

ЕПепате [6 '\'. 13 9 (0). 0 


ро1и_Рпате 04 1Тепате 


.соде 


|- 
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ЕН открываем временный файл 


хог сх. сх : атрибуты файла - обычный файл 
185 9х. ротпё_Тпате : формируем указатель на имя файла 
ОУ ак. 5ап ; номер функции 00$ 
176 РАЦ 
< тЗ : в случае ошибки — на конец 
ПЕжаЫЕ действия при успешном открытии файла 
ЮУ папд]е. ах ; сохраним дескриптор файла 
Е закрываем файл 
2: в) ан. Зе 
ем Ьх. Папе 
Ти 21и 
пс ех1{ ; переход. если нет ошибки 
1------ обработка ошибки 
тр 2 ; повторяем операцию закрытия 
+----- удаляем файл 
ех{: ЮУ ап. 41 
195 9х. роли Тпате ; формируем указатель на имя файла 
хог сх. сх : атрибуты файла 
17 2 
дис тЗ : переход. если нет ошибки 


1------ обработка ошибки 


Зтр ех1Е ; повторяем операцию удаления 
:------ выход из программы 

п3З: Е 
В случае задания имени, как в примере выше, файл будет создан в корневом 
каталоге текущего диска. Для того чтобы разместить файл в конкретном каталоге, 
необходимо указать полный путь к нему с завершающим символом \ и 13 нулевы- 
ми байтами на конце, например: 
ЕП епате [9 ‘е:\азт_оп_а\'. 13 9ир(0). 0 


Чтение, запись, позиционирование в файле 


При работе с материалом данного раздела помните, что функции чтения и записи 
можно использовать не только с дескрипторами заранее открытых файлов, но и 
с дескрипторами стандартных устройств. Эти дескрипторы имеют постоянное зна- 
чение и доступны в любое время функционирования системы: 0 — клавиатура; 
1 и2 -— экран; 3 — последовательный порт СОМ1; 4 — параллельный порт 1.РТ1. 


Установка текущей файловой позиции 


Чтение-запись в файле производятся с текущей файловой позиции, на которую 
указывает указатель позиции. Функция 421 М$ РО$ предоставляет гибкие воз- 
можности как для начального, так и для текущего позиционирования файлового 
указателя для последующей операции ввода-вывода. 

Вход: АН = 421; ВХ = дескриптор файла, полученный при его открытии; АЁ = 
начальное положение в файле, относительно которого производится операция чте- 
ния-записи (006 — смещение (беззнаковое значение в СХ:ОХ) от начала файла; 01 — 
смещение (значение со знаком в СХ:0Х) от текущей позиции в файле; 028 — смеще- 
ние (значение со знаком в СХ:0Х) от конца файла); СХ:ОХ = смещение новой пози- 
ции в файле относительно начальной. 

Выход: СЕ = 0 — ОХ:АХ = значение новой позиции в байтах относительно начала 
файла; СЕ = 1 — АХ = код ошибки: 1 — неверное значение в АЕ; 6 — недопустимый 


дескриптор файла. 


226 —Глава7. Работа с файлами в программах на ассемблере 


Методы позиционирования, заданные величиной в АЁ, по-разному трактуют 
значение в паре регистров СХ:0Х. Метод АЕ = 006 понимает значение в СХ:0Х как 
абсолютное. Два других метода (АЁ = 01В и АЕ = 02Ь ) подразумевают, что в СХ:0Х 
значение со знаком. Необходимо быть внимательным при выполнении операции 
позиционирования во избежание последующих ошибок при операции чтения-за- 
писи. Так, значение в СХ:ОХ, позиционирующее указатель, может указывать за пре- 
делы файла. При этом выделяются два случая: 


значение в С5ОХ указывает на позицию перед началом файла — в этом случае 
последующая операция чтения-записи будет выполнена с ошибкой; 


значение в СХ:0Х указывает на позицию за концом файла — в этом случае по- 
следующая операция записи приведет к расширению файла в соответствии со 
значением в СХ:0Х. 


Примеры использования функции 42Н приведем при рассмотрении функций 
чтения-записи. 


Запись в файл или устройство 
Запись в файл производится функцией 401 с текущей позиции указателя. 

Вход: АН = 40Н; ВХ = дескриптор файла; СХ = количество байтов для записи; 
05:0Х — указатель на область, из которой записываются данные. 

Выход: СЕ = 0 — АХ = число действительно записанных байтов в файл или уст- 
ройство; СЕ = 1 — АХ = код ошибки: 5 — в доступе отказано; 6 — недопустимый де- 
скриптор. 

Если при вызове функции 40Н регистр СХ равен нулю, то данные в файл не запи- 
сываются и он усекается или расширяется до текущей позиции указателя. Если (Х 
не равен нулю, то данные в файл записываются начиная с текущей позиции. Опе- 
рация записи также продвигает указатель смещения на число действительно запи- 
санных байтов. 

Положение указателя можно изменять явно с помощью функции 42Н. 

Вначале рассмотрим пример программы, выводящей данные на экран. 


ны 

$&г1й9 (6) ‘строка для вывода на экран функцией 401* 
Теп_$&г1ид = $ - ги9 

ро1пё_Тпаме 99 5419 

.соде 
ОУ ох. 1 : стандартный дескриптор — зкран 
оу сх. 1еп_$г1пд 
14$ 9х. ро1пё_Рпате : формируем указатель на строку $&г1пд 
в) ап. 40н ; номер функции 00$ 
ТИ 211 ; ВЫВОДИМ 
4 ех1 ; переход в случае ошибки 
пор ; для тестирования 


Далее поглядим на пример программы, которая заполняет файл ту_Яе.ЕхЁ дан- 
ными в виде строк символов, вводимых с клавиатуры. Длина строк — не более 
80 символов Нажатие клавиши Епег после ввода каждой строки означает, что эта 
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строка символов должна являться отдельной строкой файла ту_Ме. 1х. Соответ- 
ственно, перед выводом каждой строки в файл в ее конце необходимо вставлять 
символы 060аН. При нажатии клавиши $расе (Пробел) в начале ввода очередной 
строки (АЗСП-код — 32 (десятичный) или 20 (шестнадцатеричный)) направле- 
ние ввода данных в файл изменяется следующим образом: файл расширяется на 
величину, равную количеству уже введенных символов, и дальнейший ввод осу- 
ществляется с конца файла. Завершение работы программы определяется момен- 
том, когда оба введенных потока в файле встречаются (не перекрываясь). 


: Программа: рг907_09.а5т. Заполнение файла ту_Т11е.{хЁ данными | 
в виде строк символов. вводимыми с клавиатуры. ] 


еее н-ь- + 
Биг бай $ёгис 
1еп_Бит [9 83 : Алина Буг бай 
Леп_1п [6] °) 0 ; действительная длина введенного слова 
: (без учета 09й) 
Бир т [6] 82 дир (201) : буфер для ввода (с учетом О0Н 
; и позднее добавляем бай) 
еп4$ 
„даа 
ВапоТе Чи 0 ; дескриптор файла 
11 епате Ге) ‘Пу Пе. хе”. 0 
ролиё_Тпате 94 {1 1епате 
Е Бы бай <> 
ргеу_9 Табе! — Фмюгд : для сохранения длины предыдущей 
; строки при выводе с конца файла 
ргеу фе 0 
[в 0 
мае 99 0 : позиция в середине файла. 
; при достижении которой снизу 
: выходим из программы 
.с00е 
:------ открываем файл 
хог сх. сх ; атрибуты файла — обычный файл 
МОУ Ьх. 2 : режим доступа — доступ для чтения- 
; записи. режим буферизации М5 00$ 
МОУ 9х. 12н : если файл существует. то открыть его 
; без сохранения прежнего содержимого. 
: иначе — создать его 
19$ 51. роли _Рпате ; формируем указатель на имя файла 
оу ав. 6сп : номер функции 005 
1ие 2 : открываем (создаем) файл 
4 ехЕ ; если ошибка. то переход на конец 
------ действия при успешном открытии файла 
МОУ НапФе. ах : сохраним дескриптор файла 
ве А файловый указатель на начало файла 
ЮУ ап. 421 
хог а1. а] 
хог сх. сх 
хог 9х. ах 
ОУ Ьх. Папе 
Ия ай 
1------ вводим очередную строку с клавиатуры 
суст: ]еа 9х. Бут 
ПОУ- ай, бай 
1 21 


1------ для красоты выводим на экран символ бай 
в Ч. бан 
ие ан. 2 
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геуег$ : 


11 2 

стр БыР.БиГ Лт. 208 ; первый символ введенной строки 
: сравниваем с пробелом 

3е гемег$ ; переход на изменение ввода — добавляем 
: ба в конец введенной строки 

Теа $1. БиЁ.БиР п 

оу а1. БиР.1епй_1п 

СБм 

ризИ 51 

ада $1. ах 

ТИС $1 : учитываем неучтенный в 1еп_1п 
; символ 008 

ет Буе рёг [$1]. бап 

вывод в файл 

рор 9х : указатель на область. откуда 
: будем выводить строку 

оу Ьх. ВапФ]е 

а99 ах. 2 ; учет в Тей 1п символа бов 

ОУ сх. ах : Алина выводимых данных 

ОУ ак. 408 

116 21 

пр сус1 


записываем файл с конца, предварительно расширив его. 
узнаем. сколько было уже записано ранее: 
для этого вначале сбрасываем буферы на диск 


ОУ Ьх. Вапд7Те 

ОУ ан. 688 

19% 218 

теперь можно и узнать — определение длины файла 

оу а1. 2 

хог сх. сх - 

хог 9х. 9х : СХ:0Х = 0 - нулевое смещение 
Це) ав, 428 

Я 2 : в ОХ:АХ -> длина файла в байтах 
3с ех1{ : если ошибка 

формируем полную длину в едх 

58] еах. 16 

5119 е4х. еах, 16 

оу п100Те. едх ; сохраним как условие выхода 


; При достижении снизу 


расширение файла с помощью функции 421 1пёЁ 218 
и последующей записи; умножаем длину на 2. 

при первой операции записи файл расширится 

581 


едх. 1 
$14 есх. едх. 16 
ОУ а1. 0 
хог сх. сх 
оу ан. 425 
я 2 ; расширяем файл. устанавливая указатель 
3 ех1{ ; если ошибка 


расширим файл. выведя последнюю введенную строку с пробелом 


1]еа $1. Бы. Бир т 

оу а1. Биг. 1еп_1п 

СБи 

ризй $1 

2099 $1. ах 

ИС 51 ; учитываем в Теп_1п символ 00И 


добавляем Сай в конец введенной строки 


ОУ Бусе рёг [$1]. бай 
выводим в файл 
рор 9х : указатель на область, откуда 
: будем выводить строку 
299 ах. 2 : учитываем в 1еп_1п символ ООП 
[Ще сх. ах :; Алина выводимых данных 
ОУ ргеу. ах ; сохраним длину для корректировки 
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: при выводе следующей строки 


ОУ Бх, папе 
ОУ ан. 40и 
ИЯ 21 

с ех1{ 


1------ сбрасываем буфер. чтобы смотреть изменения в файле 
при работе в отладчике — легче запретить (см. ниже) 


ОУ Ьх. папе 
ЮУ ап, 68И 
17 2 
1------ вводим очередную строку с клавиатуры 
}еа 9х. Би 
Ще ав. бак 
я 2 


1------ для лоска выводим на экран символ бай 

ОУ 91. бан 

оу ай. 2 

тие 2п 
у------ использование 42й с отрицательным смещением относительно 
текущего значения указателя позиции: 
‘устанавливаем указатель в позицию вывода следующей строки 
с учетом того. что выводим с конца (текущей позиции) файла 


хог есх. есх 
ОУ а1. БР. }еп_1и 
СБм 
ад9 ргеу. ах 
ада ргем. 2 ; учитываем наличие 040ай 
5иБ есх. ргеу_@ : получаем отрицательное смещение — 
; сформируем его в паре СХ:0Х 
ИГд едх. есх, 16 
эИг едх. 16 ; "довернем” едх 
$Иг есх. 16 ги есх 
1------ устанавливаем файловую позицию для записи очередной строки 
Ще Ьх. папе 
оу ан. 42и 
ЮУ а}. 1 ; смещение от текущей позиции 
17% 21 
у+----- сравним текущую позицию с де 
$1] еах. 16 
$19 е0х. еах. 16 
стр едх. т04е 
м ех1& 


р сус12 
ее: Е 

Программа выглядит не очень эстетично, но главная ее цель достигнута — по- 
казать работу с файловым указателем при записи в файл. Мы попробовали разные 
варианты: позиционирование на конец файла (при этом можно узнать длину фай- 
ла); использование отрицательного смещения (задавая нулевое значение в СХ:0Х 
при АЕ = 1, можно получить в ОХ:АХ текущую позицию в файле); расширение фай- 
ла путем задания в СХ:ОХ заведомо большего значения, чем длина файла. Как видно 
из программы выше, все эти и другие эффекты достигаются за счет манипулирова- 
ния значениями в парах СХ:0Х и ОХ:АХ, а также в регистре А, где указывается на- 
чальное смещение в файле, относительно которого производится операция чте- 
ния-записи. 

В заключение рассмотрения функции 401 записи в файл отметим то, для чего 
мы использовали функцию сброса буферов на диск 68Н. Для этого коротко необхо- 
димо коснуться проблемы буферизации ввода-вывода в М5 ОО5. Эта ОС исполь- 
зует буферизацию ввода-вывода для ускорения работы с диском. В частности, дан- 
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ные, записываемые на диск, не попадают на него сразу, а помещаются вначале 
в буфер. Запись буфера на диск производится при его заполнении. Буферизация 
актуальна при интенсивной работе с одними и теми же данными. Тогда при необ- 
ходимости чтения данных с диска они будут читаться из буфера. В нашей про- 
грамме буферизация только мешала, так как при работе в отладчике мы не могли 
своевременно наблюдать за изменениями выходного файла ту_Яе.+х6. Для этого 
нам приходилось использовать функцию 68Н принудительного сохранения буфе- 
ров на диск. 

Вход: АН = 681; ВХ = дескриптор файла. 

Выход: СЕ = 0 в случае успеха; СЁ = 1 — АХ = код ошибки. 

В результате работы функции все данные из буферов дисков РО$ немедленно 
записываются на диск, при этом модифицируется соответствующий файлу эле- 
мент каталога. 

Для нашей задачи буферизацию лучше вовсе запретить, тогда отпадет необхо- 
димость в принудительном сохранении строк в файле для того, чтобы в динамике 
отслеживать его изменения. Для этого при вызове функции б6сН в регистре ВН тре- 
буется установить бит 6 следующим образом: 6 = 0 — использовать стандартную 
для М$ РО$ буферизацию; 6 = 1 — отменить стандартную для М$ ОО$ буфери- 
зацию. В нашем примере это может выглядеть так: | 


зевая открываем файл 
хог сх. сх . атрибуты файла — обычный файл 
ЮУ Ьх. 40020 ; режим доступа — доступ для 
: чтения-записи. запрет буферизации 
:------ если файл существует. то открыть его без сохранения прежнего 
Е содержимого. в противном случае создать файл 
оу 9х. 121 


145 $1. ро1пё Гпате : формируем указатель на имя файла 
ЮУ ап. бсп : номер функции 005 

17% 2 ; открываем (создаем) файл 

3с ех1Е : если ошибка. то переход на конец 


Все вызовы функции 681 в приведенной выше программе можно закомменти- 
ровать. 


Чтение из файла или устройства 


Чтение из файла в область памяти осуществляется функцией ЗЕ|. 

Вход: АН = ЗЕ!; ВХ = дескриптор файла; СХ = количество байтов для чтения; 
05:0Х — указатель на область памяти, в которую помещаются прочитанные байты. 

Выход: СЕ = 0 — АХ= число действительно прочитанных байтов из файла; СЕ = 1 — 
АХ = код ошибки: 5 — в доступе отказано; 6 — недопустимый дескриптор. 

Чтение данных производится начиная с текущей позиции в файле, которая после 
успешного чтения смещается на значение, равное количеству прочитанных бай- 
тов. Если в качестве файла используется стандартная консоль (клавиатура), то 
чтение выполняется до первого символа СК (сагпабе гебигп) с кодом ОО, соответ- 
ствующего нажатию клавиши Епег. Это, кстати, еще один способ ввода данных 
с клавиатуры в программу. Кроме символов введенной строки в ее конец помеща- 
ются символы 06 и бан. Это необходимо учитывать при задании размера буфера 
для ввода. Способ ввода данных с экрана с помощью функции ЗЕИ иллюстрирует 
представленный ниже пример программы. 
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[6 80 @ир {*“) 
Теп_51г1пд = $ - $419 


ро1пё_Тпате 94 $г1п9 
.соде 
1----- вводим с клавиатуры 
ОУ Ьх. 6 : стандартный дескриптор — клавиатура 
поУ сх. 1еп_$%г1пд 
145 9х. ро1ие_Тпате ; формируем указатель на строку 
оу ап. ЗП : номер функции 005 
Тиё 21п 
3с ех1 ; переход в случае ошибки 
;------ выводим на экран 
р (две строки ниже в данном случае можно опустить) 
ПЮУ Ьх. 1 : стандартный дескриптор — экран 
ОУ сх. 1Теп_$1г1пд 
195 9х. ро1пё_Тпате ; формируем указатель на строку $г1ид 
пу ай. 401 ; номер функции 005 
Я 2 . открываем файл 
т ех1 ; переход в случае ошибки 


Для демонстрации работы функции с дисковым файлом приведем программу 
чтения и вывода на экран содержимого файла, имя которого указывается в коман- 
дной строке. Побочная цель этой программы — научиться обрабатывать в програм- 
ме командную строку РО5$. Поясним последний момент. Содержимое командной 
строки, следующее за именем программы при ее вызове, помещается в префикс 
программного сегмента (РЗР) со смещением 801 отего начала и максимально име- 
ет размер 128 байтов. Первый байт этой области содержит длину параметров ко- 
манды, а первый символ параметров, при его наличии, располагается со смещени- 
ем 816 отначала РР. Последний символ параметров команды — всегда ОН. Начало 
РР найти очень легко — когда программа загружается в память для исполнения, 
то загрузчик устанавливает регистры Е$ и 0$ равными адресу РР. 


Программа: рг907_11.а5т. Чтение и вывод на экран содержимого файла. 
имя которого вводится в команлной строке. 


неее н- + + 
„Дафа 

Те папе до 128 дир ("“") ; буфер для пути к файлу 

ролйё Тпате 99 +11е_пате 

$179 [#19] 80 @р ("“) 


Теп_51г1й9 = $ - 5г19 
ротиЕ_$Е гид 94 $&г1пд 


Кап] е ди 0 ; дескриптор файла 
$12е_Р 99 0 : размер файла 
„.соде а 

мати: 


-- копируем командную строку в 11]е_пате; 


вначале уберем (установкой указателя) ведущие пробелы 
в командной строке перед путем к файлу 


ОУ 91, 81 
ЮУ а: 
ОУ сх. 128 
гере зсазЬ 
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: адрес сегмента данных — в регистр АХ 
; ах в е5 


: режим доступа — только чтение 


формируем указатель на имя файла 


: номер функции 005 


; переход в случае ошибки 
: дескриптор файла - в Бх 
: СХ:0Х =0 — нулевое смещение 


; в ОХ:АХ -> длина файла в байтах 
; если ошибка 


дес 91 
ризп 91 
рор $1 
ом ах. @Чака 
оу ез, ах 
оу с1, 8$:[80Н] 
Чес с] 
}еа 91. Пе папе 
гер поу$Ь 
ризп е5 
рор 95 
------ открываем файл 
ом 81. 00п 
14$ ах. ротпе_Тпате ; 
По\ ан, зай 
17 218 
3 ех{ 
пом Нап Те. ах 
------ определяем размер файла 
поу Ьх. ах 
оу а1. 2 
хог сх, сх 
хог 9х. ах 
[ще ан. 420 
тие 21й 
3с ех& 
------ формируем полную длину в еах 
$1 еах. 16 
$814 — е4@х. еах. 16 
оу $12е_Т, еах 


; сохраним как условие выхода 


: при достижении снизу 


де Ьх. папе 
пом а1. 0 
хог сх. сх 
хог Чх. ах } 
пом ан. 428 
я 21и 
дс ех1Е 
------ читаем файл по 1Теп_$0г1пд 
сус1 оу Ьх. папе 
оу сх. 1еп_${г1пд 
145 @х. ротие_$г1т9 : 
[ще ап. зп : 
17 21и 
с ех1е : 
------ выводим на экран целиком 
ОУ Ьх. 1 . 
оу сх. Теп_$ег1ид 
145 ах, ротпЕ_ $19 : 
пом ан. 408 : 
тт 21и 
3 ех{ 
сиае 
$6 $12е_Т. еах 
стр $12е_+. 0 
Де ех1{ 
Эр Сус] 
------ выход из программы 
ех1{: оу 1. 1 
218 


1 


устанавливаем указатель на начало файла 
: дескриптор файла - в 6х 


СХ:0Х =0 — нулевое смещение 


; текущий указатель в начале файла 
; если ошибка 


байтов 


: дескриптор файла в Бх 


форнируем указатель на строку 
номер функции 005 


: открываем файл 
; переход в случае ошибки 


; стандартный дескриптор — экран 


формируем указатель на строку 


: номер функции 005 

: открываем файл 

: переход в случае ошибки 

; расширяем количество выводимых байтов 


: достигли конца файла? 


Не забывайте после определения размера файла возвращать файловый указа- 


тель в нужное место файла. 
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Получение и изменение атрибутов файла 


М$ 005 позволяет получить для анализа и при необходимости изменить имя фай- 
ла, байт атрибутов файла, время и дату его последней модификации в соответству- 
ющем элементе каталога. Для этого предназначены функции 431, 561, 57Н. Под- 
функция 00Н функции 431 прерывания 21Н предназначена для получения слова 
атрибутов файла. 


Получить атрибуты файла 


Вход: АХ = 43006; 05:0Х — АЗСПИ7-строка с именем (путем) файла. 

Выход: СЕ = 0 — СХ = слово атрибутов файла; СЕ = 1 — АХ = код ошибки: 1 — 
неверное значение в А(; 2 — файл не найден; 3 — несуществующий путь; 5 — дос- 
туп запрещен. 

Е | 


тпате [61 "таке .азт” 
ротпё_Тпате 94 тпате 


.соае 


;-----= получим атрибуты файла 
1495 9х. ротие_Тпате ; формируем указатель на строку 


оу ах. 43001 : номер функции 00$ 
тт 21й 
м6 ех{ ; переход в случае ошибки 


а :; в сх атрибуты (см. ниже) 
Напомню формат байта атрибутов: 





Установить атрибуты файла 


Подфункция 01А функции 431 прерывания 211 предназначена для установки зна- 
чений слова атрибутов файла. 

Вход; АХ = 4301Н; СХ = новое слово атрибутов файла; 0$:0Х — АЗСП-строка 
с именем (путем) файла. 

Выход: СЕ = 0 — АХ = не определен; СЕ = 1 — АХ = код ошибки: 1 — неверное 
значение в А; 2 — файл не найден; 3 — несуществующий путь; 5 — доступ за- 
прещен. 
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Переименовать файл 


Для переименования файла используется функция 56Н. 

Вход: АН = 56Н; 0$:0Х — АЗСПА-имя существующего файла; Еб:0Т — АЗСПИЯ- 
имя нового файла; С! = маска атрибутов. 

Выход: СЕ = 0 — при успешном переименовании; СЁ = 1 — АХ = код ошибки: 2 — 
файл не найден; 3 — несуществующий путь; 5 — доступ запрещен; 116 — устрой- 
ства для старого и нового файлов не совпадают. 

Функция 56 позволяет произвести перемещение между каталогами, не изме- 
няя устройства. 


Программа: рг907_13.азт. Перемещение между каталогами 
без смены устройства функцией 568. 





еее нее + 
. дата 
Тпате_$ [61 "пакег.азт". 0 
ротп_Тпате_$ 94 Тпате_5 
Тпате_а [е "е:\такег.азт". 0 
роте Гпате а да Тпате_а 
.соае 
1------ переместим файл из текущего в корневой каталог 
195 9х. ро1пЕ_Гпате_5 : указатель на Гпате_$ (исх. файл) 
1е5 91. ро _ - паше @ ; указатель на Тпате_@ {целев файл) 
Мом ай. 560 ; номер функции 005 
те 21н 
< ехат : переход в случае ошибки 


: в сх атрибуты (см. ниже) 


Получить дату и время создания или последней 
модификации файла 
Получить/изменить дату и время создания или модификации файла можно с по- 
мощью подфункций функции 571. 
Вход: АХ = 5700Н; ВХ = дескриптор файла. 
Выход: если СЕ = 0 — СХ = время, ОХ = дата. Если СЕ = 1 — АХ = код ошибки (СЕ = 1): 
1 — недопустимый номер подфункции в АГ; 6 — недопустимый дескриптор. 
Время и дата файла получаются в следующих форматах. 


СИИ ПИК: НИИ НИ 
15-11 Часы (0-23) 





ИО ЕТ ВИ 
[4-0 бюшы [40 | 


Установить дату и время создания 

или последней модификации файла 

Вход: АХ = 57011; ВХ = дескриптор файла; СХ = новое время, ОХ = новая дата. 
Выход: если СЕ = 0 — СХ = время, 0Х = дата. Если СЁ = 1 — АХ = код ошибки: 1 — 

недопустимый номер подфункции в А(; 6 — недопустимый дескриптор. 


ею. ии они 


=— 
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Работа с дисками, каталогами 
и организация поиска файлов 


Задача поиска традиционно является актуальной. При рассмотрении вопроса ра- 
боты с файлами ее также не обойти. Мы рассмотрим номенклатуру средств, пред- 
лагаемых М5 ОО$ для поиска файла и определения его местоположения в древо- 
видной структуре каталогов текущего диска. 

Знакомясь с предыдущими программами, вы должны были заметить, что при 
задании имен файлов мы практически не указывали имен дисководов и путей 
к этим файлам. М$ 00$ имеет средства для установки текущего диска и каталога, 
в котором выполняются все текущие операции с файлами. При необходимости те- 
кущий диск и каталог можно изменить. Ниже приведено несколько функций для 
работы с текущими диском и каталогом — определение, смена, получение инфор- 
мации. 


Получить номер заданного по умолчанию дисковода 


Вход: АН = 19Н. 
Выход: АЁ - номер дисковода {001 — А:, 011 — В: ит. д.). 


: Программа: рг907_14.азт. Получение номера текущего (по умолчанию) | 
дисковода функцией 191. | 


14----- получить номер текущего (по умолчанию) дисковода 


Де ай. 191 : номер функции 005 
тие 21 
3с ех1{ ; переход в случае ошибки 


‚; ва] номер текущего диска 


Выбрать заданный по умолчанию диск 


Вход: АН = ОЕн; ОЁ = номер нового диска по умолчанию (001 — А:, 018 — В: ит. д.). 
Выход: АЁ = максимально возможный в данной системе номер дисковода (001 — 
А:, 016 — В: и т. д.) определяется на основе параметра ГАЗТОЕТУЕ в файле СОМЕб.5\5. 


Получить информацию о свободном дисковом 
пространстве 
Вход: АН = 36Н; 01. = номер диска (008 — текущий, 01Н — А: ит. д.). 

Выход: АХ = РЕРЕН — неправильный номер устройства в 0; иначе: АХ = число 
секторов в одном кластере; ВХ = количество свободных кластеров; СХ — размер сек- 
тора (в байтах); ОХ = общее число кластеров на диске. 

Используя информацию, возвращаемую функцией 361, можно подсчитать как 
свободное пространство на диске — произведение АХ х ВХ х СХ, так и полный объем 
диска — произведение АХ х СХх 0Х. 

М$ 2О5 предоставляет следующие возможности для манипулирования ката- 
логами: создание и удаление каталога, получение информации о текущем каталоге 
и его смена. 
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Создание каталога 


Вход: АН = З9Н; 05:0Х — АЗСИЙ-строка пути к создаваемому каталогу. 

Выход: АХ = не определен (СЕ = 0); АХ = код ошибки (СЕ = 1): 3 — несуществую- 
щий путь; 5 — доступ запрещен. 

Путь к каталогу должен содержать перечисление всех каталогов начиная от 
корневого на пути к создаваемому каталогу; при этом они, естественно, должны 
сушетровать Последнее имя пути — имя создаваемого каталога. 


и. 
Чпате [61°] "С: \итпдоиз\ту г”. 0 
ротпЕ_апате да Чпате 
.соде 
1------ создадим каталог в каталоге с: \итпд0м$ 
14$ @х. ро1п @пате :; формируем указатель на строку 
; С именем нового каталога 
том ап. З9в ; номер функции 00$ 
170 21 
3 ех1ф ; переход в случае ошибки 
Удаление каталога 


Вход: АН = ЗАВ; 0$:0Х — АЗСПИЙ-строка пути к удаляемому кагалогу. 
Выход: СЕ = 0 — АХ = не определен; АХ = код ошибки (СЕ = 1): 3 — несуществую- 
щий путь; 5 — доступ запрешен; 10В — попытка удаления текущего каталога. 
Удаляемый каталог должен быть пустым. 


а 
Чпате [в] "с: \иИпдои$\ту_@ г", 0 
ро1п_@пате 94 Чпате 
.соде 
----- удалим каталог ту_Ч1г в каталоге с: \мтпдомб 
145 дх. роли _@пате :; формируем указатель на строку 
; С именем нового каталога 
ЮУ ан. Зав ; номер функции 00$ 
178 21и 


дс ех{ : переход в случае ошибки 


Изменить текущий каталог 


М5 00$ позволяет установить текущий каталог для того, чтобы не указывать пол- 
ный путь для последующих операций с файлами. При необходимости можно по- 
лучить полный путь к текущему каталогу в виде АЗСИЙ-строки. 

Вход: АН = ЗВВ; 05:0Х — указатель на буфер, содержащий полный путь от корне- 
вого каталога в виде АЗСИ7-строки (до 64 байтов). 
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Выход: СЁ = 0 — АХ = не определен; СЁ = 1 — АХ = код ошибки: 0ЗЬ — путь не 
кадеН 


в: 
Чпате [616 "С: \иЙпдом$", 0 
ротпЕ_апате 94 Чпате 
.соде 
ЕЕЕНЕ изменим текущий каталог на каталог с:\м1п@ои$ 
74$ 4х. ро1пЕ_@пате : формируем указатель на строку 
; с именем нового каталога 
ме ан. З5п : номер функции 00$ 
тп 21и 
3 ех1& ; переход в случае ошибки 


` 


Получение текущего каталога 
Вход: ОАН = 47Н; 01 = номер устройства (001 = текущее (по умолчанию), 018 — А: 
ит. д.); 05:51 — указатель на 64-байтовый буфер для записи полного пути от корне- 
вого каталога (АЗСП7-строка). 

Выход: АХ = не определен или 01001 (СЕ = 0); 

АХ = код ошибки (СЕ = 1): ОЕВ — недопустимый дисковод. 


"а 
Чпате [9] "е:\10015". 0 
ро1пё_дпате 94 Чпате 
Ч сиг_пате [61 64 дир (208). 0 
ро1ие_Ч сиг_пате аа Ч сиг пате 
.соде 
1------ изменим текущий каталог на каталог \{001$ 
145 Ч9х. ротпё_апате : формируем указатель на строку 
; с именем нового каталога 
пом ай, ЗП ; номер функции 008 
тт аи 
4 ех1\ ; переход в случае ошибки 
1------ получим текущий каталог 
145 $1. роте 4 сиг пате : формируем указатель на строку 
: С именем нового каталога 
поу ан. 478 : номер функции 00$ 
17 21и 
$ ех1 ; переход в случае ошибки 


ВоаеЕНИХ путь не содержит имени диска и первого символа \, 

Последняя проблема, на которой мы остановимся в этом разделе, — проблема 
поиска файлов. Для поиска в каталогах используется пара функций — 4ев и 4. 
В имени искомого файла можно указывать символы подстановки * и ?. Совмест- 
ное использование функций 4ей и 4 подчинено следующему алгоритму. Первой 
вызывается функция 4ей. В качестве параметров ей передаются адрес АЗСП7-стро- 
ки с путем к искомому файлу и комбинация его атрибутов. Имя файла может быть 
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задано в виде шаблона. В случае успеха (СЕ = 0), то есть при обнаружении первого 
подходящего шаблону файла данная функция помещает его имя и расширение в 
область ОТА со смещением 1ЕВ отее начала (см. таблицу ниже). Далее можно либо 
открыть файл, либо продолжить поиск, но уже функцией 4ЕИ. При работе с шабло- 
ном функцию 4Е1 разумно вызывать циклически, до тех пор пока в процессе пере- 
бора не будут просмотрены имена всех подходящих файлов. Об этом можно уз- 
нать по состоянию флага (Е, которое должно стать равным 1 в случае, когда файлов, 
удовлетворяющих шаблону, в данном каталоге больше нет. 


Поиск первого удовлетворяющего шаблону файла 


Вход: АН = 4ЕВ; СХ = атрибуты файла (биты 0 и 5 игнорируются); 05:0Х — АЗСИ7- 
имя файла (возможно, с путем к нему и символами шаблона * и ?). 

Выход: если СЁ = 0, то в ОТА возвращается блок данных для первого найденно- 
го файла (см. ниже). Если СЕ = 0, то в АХ = код ошибки: 2 — файл не найден; 3 — 
несуществующий путь; 12| — больше файлов в каталоге нет. 

Область ОТА (Пава Тгалзег Агеа) располагается в префиксе программного сег- 
мента со смещением 806 отего начала и занимает 128 байтов. При успешном окон- 
чании поиска функция 4ЕВ (и 4ЁВ тоже) формирует блок данных, имеющий приве- 
денный ниже формат. 


Я И Буква логического диска, если бит 7 = 0, 
то удаленный диск 
и евый ша, 
ИИ ГОН ТВИН 
2 | Порядковый помер файлавкаалое 
2 [| Номрюлштера начала каталога предыдущего уровня __ 
Ее Ч. А: в 
| Арибуы найдено фана 
1 |2 [| Времясовдания (модификации) йа 
ГВ ИВ Е ИНИИНИ 
ей 


Размер файла 


ВЫ ГПО А$СП7-имя файла с расширением 


После анализа данной области в программе принимается решение об оконча- 
нии или продолжении поиска. 

В качестве шаблона можно задать символы *.*, тогда мы сможем получить име- 
на и проанализировать все файлы в текущем каталоге. Это бывает полезным при 
программировании операции перемещения или копирования каталога. 





















Найти следующий соответствующий шаблону файл 


Вход: АН = 4РИ; в области ОТА должен содержаться блок данных, заполненный 
единственным вызовом 4ей в начале поиска. 
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Выход: если СЕ = 0 — успех; если СЕ = 1 — в АХ = код ошибки; 12} — больше 
файлов в каталоге нет. 

Для работы с ОТА в системе М$ РО$ существуют две функции: Лан и 24. Пос- 
ле старта программы текущей ОТА является область по адресу Р5Р:0080В. Мы уже 
имели с ней дело, когда рассматривали проблему обработки содержимого команд- 
ной строки. 


Получить адрес области ОТА 


Для выполнения работы, связанной с файлами, М$ ОО$ предоставляет возмож- 
ность установить собственную область ОТА. 

Вход: АН = 2Е1. 

Выход: Е5:ВХ — адрес области, которую впоследствии функцией 1аН можно сде- 
лать текущей областью ОТА для последующих операций ввода-вывода. 


Установить текущую область РОТА 


Вход: АН = 1АВ; 05:0Х — адрес области, которая будет областью ОТА для последую- 
щих файловых операций. 

Понятно, что даже если мы устанавливаем свою область ОТА, все смещения 
и данные, формируемые функциями 4ЁН и 4Р, остаются актуальными. 


Работа с файлами в М$ ОО$ 
(длинные имена) 


Перечисленные выше функции работают в различных версиях «чистой» системы 
М5 ОО5, вплоть до версии 6.22 включительно. Операционные системы \У/т- 
4о\з$ 95/98/Ме также поддерживают свою версию М5 ОО5, которая имеет но- 
мер 7.0. Операционные системы УЛю4о\$ 95/98 /Ме организуют для программ М$ 
20$ специальное окружение, называемое сеансом РО5. Система М5 2О$ 7.0, бу- 
дучи созданной для работы в среде \/т4о\з 95, имеет в своем составе средства 
для работы с файловой системой УЛт4о\з. Эта файловая система, как известно, 
отличается тем, что полное имя файла может достигать длины до 255 символов. 
М5 0095 7.0 также умеет работать с длинными именами файлов. В данном разделе 
мы рассмотрим предназначенные для работы с файловой системой УЛт4о\з сред- 
ства среды М$ 2О$, работающей под управлением \/1т4о\5. 

Определить факт того, в какой системе работает программа, можно по резуль- 
татам работы функций 301 — получить версию РО$ (прерывания 211) и 4а3 ЗН (пре- 
рывания 2). 

Использование функции ЗОН предполагает следующие входные и выходные 
значения: 

Вход: АН = ЗОН; АЁ = определяет значение, возвращаемое в ВН: 006 — ОЕМ-но- 
мер (как для ОО$ 2.0—4.0х); 011 — номер версни. 

Выход: АЁ = старший номер версии; АН = младший номер версии; ВЁ:СХ = 24- 
битовый серийный номер пользователя (необязательно). 
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.соде 
------ определим номер версии 0С № 005 
ОУ а1. 00 
1 ан. зов : номер функции 00$ 
17 21п ; А = главный номер версии. 
; АН = младший номер версии 
3 ех1{ ; переход в случае ошибки 


В регистрах АЁ и АН возвращаются главный и вторичный номера версии М$ 
005$. При функционировании под УЙпао\$ эти номера равны 071 и бай соответ- 
ственно. Задание значения А! = 1 дает такой же эффект. 


ее 
1--=--- определить факт работы в среде М5 005 7.0 
пом ах. 4а3ЗИ ; номер функции 005 
1 21 
стр ах. 0 
пе ех1{ ; переход. если не М5 00$ 7.0 


Последняя функция возвращает 0 для М5 ОО5 версии 7.0 и выше. 

Установить факт того, что система поддерживает длинные имена файлов, мож- 
но вызовом функции 71а0Н прерывания 211 — получить информацию о томе. Если 
она возвращает ошибку (СЕ == 1), то текущая файловая система не поддерживает 
длинных имен файлов. Для вызова этой функции необходимо указать корневой 
каталог интересующего тома. 

Вход: АХ = 71АОН; 05:51 — АЗСИЙ-имя корневого каталога тома, о котором нуж- 
но получить информацию (например, С:\); Е5: ОТ — буфер для имени файловой си- 
стемы; СХ = размер буфера, адрес которого задан в Еб:01 (32 байта). 

Выход: СЕ = 0 в случае успеха, следующие регистры установлены: ВХ = флаги 
файловой системы: 0 — при поиске учитывать регистр букв в именах файлов; 1 — 
сохранять регистр букв в элементах каталога; 2 — использование символов Фшсо4е 
в именах каталогов и файлов; 3-13 — резерв (0); 14 — поддержка 2О5-функций 
для длинных имен файлов; 15 — сжатый том; СХ = максимальная длина файловых 
имен (обычно 255); ОХ = максимальная длина пути (обычно 260); Е5: ОТ — в буфере 
по этому адресу находится АЗСП-имя файловой системы, например РАГ, ЕАТЗ2, 
МТРУ, СОР; СЕ = 1 в случае неудачи, при этом АХ = код ошибки или АХ = 71001, если 
т не поддерживается. 


"аа 

дпате [@1) "С" 0 
ро1пе_дпате 98 дпате 

Г пате а 64 Чир (208). 0 
ро1и_Г пате аа + паме 

.с0де 


------ определить факт поддержки длинных имен файлов 
149$ 51, ро1пЁ @пате 
1е$ 91. роте Г пате 
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ПОУ сх. 32 

том ах. 71а0и : номер функции 005 

Тиё ан 

[о ех1{ : переход. если текущая файловая система 


: не поддерживает длинных имен файлов 


В Ушдо\ 95/98 появились дополнительные возможности как самой файло- 
вой системы, так и средств по ее управлению. Основное нововведение — поддерж- 
ка длинных имен файлов. Основа файловой системы та же — таблица размещения 
файлов ЕАТ, но любой файл в этой системе имеет два имени — длинное имя и его 
псевдоним, который соответствует формату 8.3. Данный псевдоним создается сис- 
темой \/ш4о\з 95/98 автоматически. 

Нужно правильно понимать различие в способах использования длинных имен 
файлов в приложениях М5 РОЗ и \т32. Приложения М$ РО$ получают доступ 
кдлинным именам файлов с помощью дополнительных функций прерывания 21Н. 
Приложения У/1тдо\$ используют для этого соответствующие функции АРТ. 

Длинное имя файла представляет собой АЗСП7-строку длиной до 255 симво- 
лов. Система формирует псевдоним для этого имени форматом 8.3 в соответствии 
со следующим правилом: берутся первые 6 символов длинного имени, после них 
добавляется символ тильда (--), за тильдой ставится некий порядковый номер. Для 
первого имени формата 8.3 это 1. Если такой псевдоним уже существует, то поряд- 
ковый номер очередного псевдонима будет на единицу больше. Расширение псев- 
донима формируется из первых трех символов расширения длинного имени (если 
оно существует). Если похожих имен много, то номер в псевдониме может быть 
двузначным, при этом первая (символьная) часть псевдонима сокращается до 5 сим- 
волов ИТ. Д. 

Рассмотренные выше функции М$ ОО$ для работы с файлами и каталогами 
не поддерживают длинных имен. Для этого система У/т4до\ 95/98 предоставля- 
етприложениям М$ РО$ аналогичные функции, но имеющие другие номера. Впро- 
чем, при внимательном рассмотрении большинства из этих номеров видно, какой 
из старых функций они соответствуют. Новые номера состоят из четырех цифр: 
первые две — 718, последние две — номер старой функции. Для некоторых функ- 
ций существуют особенности в их работе. Так, для поиска файлов по-прежнему 
используются две функции (по новой нумерации — 714ей и 7141) прерывания 211. 
Новые функции теперь помещают информацию о файлах в специальную структу- 
ру М!№32_ЕМО_ОАТА, адрес которой возвращается в качестве результата их работы. 

При работе с функциями, поддерживающими длинные имена файлов, исполь- 
зуются еще две структуры: В\_НАМОЕЕ_ЕЩЕ_ТМЕОВМАТТОМ и ЕТЬЕТТМЕ. Назначение 
структуры ВУ_НАМОТЕ_ЕПТЕ_ТМЕОВМАТТОМ и работу с ней мы рассмотрим при обсуж- 
дении функции М$ РО$ 71а6Н. Структура НТЕЕТМЕ содержит 64-разрядное значе- 
ние, которое определяет число стананосекундных интервалов, прошедших с 12:00 
утра 1 января 1901 года. 


ЕЕТ1МЕ УЕгис 
Ом. оОатетлте 94 ? ; младшие 32 бита значения времени 
ОиНзапОэтет1те @4 ? ; старшие 32 бита значения времени 
ЕЕТМЕ епа$ 


Теперь приведем перечень функций прерывания 211, работающих с файлами, 
которые имеют длинные имена. Для удобства дальнейшего рассмотрения в следу- 
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ющей таблице представлены соответствующие функции АРТ \/1132 и «старые» 
функции прерывания 211. 


Новая Старая Нвзначение Функция АР! М/п32 
функция | функция 
111218 111218 









Получить дату и время последнего СеЕИеТите 

доступа 
Установить дату и время последнего |Зе Е|еТите 
доступа 


Получить дату и время создания СеЕЙеТите 


сл [м <л сл 
за з з 
с |© © © 
з |5 сл 754 
= |= = = 


> 
— 
> 
> 
= 


Получить или установить атрибуты |СеЕПеАгтЬишез, 
файла Зе ЕЙеАиЬитс$ 


7143Ь 






Получить полный путь с краткими  |СеЗКогРа Мате 
именами 
Получить полный путьс длинными | Отсутствует 
именами 
716СЬ ЗСВ, ЗОВ, | Создать или открыть файл СгеажеЕЙе, ОрепЕИе 
5ВЬ 


71 АбЬ Получить информацию о томе СеУоштеПЮппаНоп 
АВ Иа Созе 


71АбЬ Получить информацию о файле СеЕНетЮгтанопВуНа е 
по описателю 

71 А7Ь Преобразовать время файла ЕИеТипеТорО$ОажеТипе 
в ОО5-время 


Преобразовать из ОО5-времени 
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Остановимся на наиболее интересных в контексте нашего изложения функци- 
ях этой таблицы. Информацию по остальным функциям можно получить, в част- 
ности, из библиотеки МОМ. Порядок рассмотрения проведем от простых функ- 
ций к сложным так, как это было в предыдущем разделе, посвященном функциям 
работы с файлами М$ РО$, имеющими короткие имена. 


Создание, открытие, закрытие и удаление файла 


Функции М$ РО$, поддерживающие длинные имена файлов, имеют номера из 
четырех цифр — первые две равны 711, последние две соответствуют номеру ана- 
логичной старой функции М$ ОО$. В программах старые и новые функции при- 
меняются вместе по принципу: там, где функция должна работать непосредствен- 
но с длинными именами файлов и каталогов, срабатывают новые функции; там, 
где функции нужен дескриптор файла, используются старые функции. Новые фун- 
кции также предназначены для реализации новых возможностей по работе с фай- 
ловой системой. 


Открытие или создание файла 


Для создания или открытия файлас длинным именем используется функция 71608 
(создать или открыть файл). Эта функция аналогична функции бсй, которая по- 
явилась в последних версиях М5 ООЗ (005 4.0+). Мы уже обсуждали ее в разде- 
ле, посвященном функциям работы с файлами с короткими именами. 

Вход: 

АХ = 716СН; 

ВХ = режимы доступа и флаги: 


С режим доступа: 00008 — файл только для чтения; 00011 — файл только для 
записи; 00028 — файл для чтения и записи; 00031 — резерв; 00041 — открыть 
файл для чтения без изменения даты последнего доступа к файлу; 


С режим разделения: 00001 — режим эмуляции — файл можно открывать лю- 
бой программе любое количество раз; 00101 — файл открыт в монопольном 
режиме доступа; 0020Н — файл открыт в монопольном режиме доступа по 
записи; 00З0Н — файл открыт в монопольном режиме доступа по чтению; 
00408 — открыть файл, разрешая другим процессам доступ по чтению-запи- 
си, но с запретом режима эмуляции; 


С флаги: 00801 — дочерний процесс не наследует дескриптор файла, его при 
необходимости нужно передавать явно; 01001 — не использовать буфериза- 
цию или кэширование средствами ОС, операции чтения-записи выполня- 
ются напрямую с диском в соответствии с текущим положением указателя 
позиции; 02001 — файл нельзя сжимать; 04001 — содержимое регистра ОТ 
следует трактовать как порядковый номер в псевдониме файла; 20001 — не 
вызывать обработчик критической ошибки (1тЁ 241), М$ РО$ вернет про- 
грамме код ошибки; 40001 — после каждой операции записи М$ ОО$ будет 
отправлять данные на диск без их кэширования; 


СХ = атрибуты создаваемого (и только) файла: 00001 — файл доступен по запи- 
си ичтению; 00011 — файл доступен по чтению; 0002} — скрытый файл; 00041 — 
системный файл; 00081 — метка тома; 00201 — архивный файл; 
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ОХ = действия, если файл существует или несуществует, значения битов: 00108 — 
вернуть ошибку, если файл существует, иначе создать файл; 00011 — открыть 
файл, если он существует, иначе вернуть ошибку; 00021 — открыть файл без 
сохранения существующего, в противном случае вернуть ошибку (если файл 
не существует); 

05:51 — АЗСПИЙ-имя файла; 


01 — порядковый номер, который добавляется к концу имени в псевдониме 

файла (для этого должен быть задан флаг 04001 в регистре ВХ). Номер будет 

десятичным письмом, то есть если 0] = 00101, то конец псевдонима — -16. 

Выход: СЕ = 0 — успешное выполнение функции: АХ = дескриптор файла, СХ = 
= состояние: 1 — файл открыт; 2 — файл создан и открыт; 2 — файл открыт без 
сохранения содержимого существующего файла; СЕ = 1 — АХ = код ошибки. 

После того как файл открыт или создан функцией 716СВ, с ним можно работать, 
используя старые функции чтения-записи и позиционирования. Следующий фраг- 
мент программы показывает вариант применения функции 716С1. 


Программа: рг907_22.азт. Применение функции 716СИ для создания 
или открытия файла с длинным именем. 





ее ен ---- + 
„дата 

Пап] е [6 0 ; дескриптор файла 

{1 1епате [61°] 'Пу_ Ее мтЕИ 1079 пате.+хе’, 0 

ротпе_Гпате [ее 111епате 

.с0де 


У еЫ Открываем файл 
оу Бх. 0100/+0400й : не использовать буферизацию + 
; содержимое ОТ в псевдоним 


оу 9х. 1 : открыть файл. если он существует. 
: иначе вернуть ошибку 
145 $1. ро Тпате : формируем указатель на имя файла 
тоу а. : добавить в конец псевдонима символ 7 
гереа*: оу ах. бон : номер функции 00$ 
хог сх. сх ; атрибуты файла — обычный файл -— 
; доступ для чтения-записи 
116 21и 
дис т] ; если файл существовал. то переход 
оу 4х. 101 : создать файл 
тр гереа* ; переход — повторим открытие файла 
ЕЕ действия при успешном открытии файла 
т]: оу КапФе. ах ; сохраним дескриптор файла 


Закрытие файла производится функцией ЗЕВ, которая использовалась для фай- 
ловых функций М5 РО$ с короткими именами. 


Удаление файла 

Удаление файлов, имеющих длинные имена, производится функцией 71411 пре- 
рывания 218. Имя файла может быть задано при помощи символов шаблона * и ?, 
тогда в результате работы функции будут удалены все файлы, чье имя удовлетво- 


ряет заданному шаблону. 
Вход: АХ = 71418; $1 = ограничения поиска: 0 — символы шаблона в имени файла 
и атрибуты в СХ для поиска не разрешены; 1 — можно задавать символы шаблона 


| 
| 
| 
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в имени файла и атрибуты в СХ для поиска; СХ — обязательные (СН) и необязатель- 
ные (СЕ) атрибуты для поиска удаляемых файлов: ООН — файл для чтения-записи; 
011 — файл только для чтения; 02} — скрытый файл; 041 — системный файл; 081 — 
метка тома; 101 — каталог; 201 — архивный файл; 05:0Х — АЗСИ7-имя файла (сим- 
волы шаблона разрешены, если $] = 1 (см. выше)). 

Выход: СР = 0 — успешное выполнение функции (АХ = не определен); СЕ = 1: 
АХ = код ощибки: 2 — файл не найден; 3 — нет такого пути; 5 — в доступе отказано; 
АХ = 7100Н — функция не поддерживается. 


т Программа: рг907_23.азт. Применение функции 71411 прерывания 21И | 
для удаления файлов. имеющих длинные имена. | 


Я 
ен - + 
.дата 
Пап] е 9м 0 : дескриптор файла 
111 епате [6 "Пу Ге м1 (И 1опд пате.%хЕ”. 0 
рофпЕ_Тпате [ве Иепате 
Гтате_де1 [@ 'ту_Ре ити 1019 пате.*’, 0 
ротпЕ_Тпате_ де] 44 фпате_ де] 
.соде 
БЕВаЕЫЕ открываем файл 
[ей Ьх. 0100/+04000 : не использовать буферизацию + 
: содержимое ОТ в псевдоним 
оу 9х. 1 ; открыть файл. если он существует. 
: иначе вернуть ошибку 
245 $1. ро1иё_Рпате : формируем указатель на имя файла 
Ще) 91. 7 : добавить в конец псевдонима символ 7 
гереа{ : оу ах. 716сИ : номер функции 00$ 
хог сх. сх : атрибуты файла — обычный файл — 
: доступ для чтения-записи 
пе 21 
пс ии ; если файл существовал. то переход 
оу 4х. 108 : создать файл 
пр гереа+ : переход — повторим открытие файла 
1------ действия при успешном открытии файла 
т: оу папе. ах : сохраним дескриптор файла 
1------ удалим файл 
хог сх. сх ; атрибуты файла 
поу $1. 1 : будем использовать шаблон для поиска 
; и последующего удаления 
14$ ах. ротпё_Тпате_4е] : формируем указатель на имя файла 
Ще) ах. 71411 


11% и 


Врезультате работы этой программы будет создан файл ту_Не м юпд пате Е 
который затем будет удален в соответствии с шаблоном ту_Ее мВ [опд пате.*. 

Чтение, запись, позиционирование в файле, имеющем длинное имя, произво- 
дится старыми функциями М$ РОЗ З# и 401. 


Получение и изменение атрибутов файла 


В <старой» М$ 20$ существовал ряд функций для получения и установки таких 
характеристик файла, как его атрибуты, время создания или последней его моди- 
фикации. В версии М$ 2О$, используемой в \Лп4о\5, также имеются подобные 
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функции, но у них есть свои особенности. Эти особенности объясняются тем, что 
в \/1132 несколько расширен набор характеристик, связанных с файлом. Поэтому 
для получения и изменения атрибутов файла требуется функция 71431, которая 
по сравнению с аналогичной функцией 431 работает с больщим объемом инфор- 
мации. Так, помимо информации об атрибутах файла, функция 7143Н формирует 
время и дату создания и модификации файла. Следует отметить, что в \ 132 с фай- 
лом связаны три значения времени: время создания файла, время последнего до- 
ступа к файлу и время последней записи в файл. Ниже приведены дополнительные 
функции для работы с этими характеристиками файла в УЛп4о\-версии М$ РО$5. 


Получить дату последней модификации файла 
Вход: АХ = 57041; ВХ = дескриптор файла. 

Выход: СЕ = 0 — успешное выполнение функции (СХ = 00001), ОХ = биты уста- 
новлены следующим образом: 0—4 = день месяца в диапазоне 1-31; 5—8 = месяц 
в диапазоне 1-12; 9-15 = число лет начиная с 1980 года. СЕ = 1 — АХ = код ошибки. 

Получение времени последней модификации не реализовано, в чем можно убе- 
диться, вставив в свою программу следующий фрагмент: 


пом Бх. Нап е 


ОУ ах. 5704й 
ИАЯ и 


3с ех1{ : переход. если ошибка 


Получить дату и время создания файла 


Вход: АХ = 5706Н; ВХ = дескриптор файла. 

Выход: СЕ = 0 — успешное выполнение функции: СХ = биты установлены следу- 
ющим образом: 0—4 = секунды, деленные на 2; 5-10 = минуты (0-59); 11—15 — часы; 
ОХ = биты установлены следующим образом: 0—4 = день месяца в диапазоне 1-31; 
5-8 = месяц в диапазоне 1-12; 9-15 = число лет начиная с 1980 года; $[ = двоичное 
значение количества десятимиллисекундных интервалов, добавляемых ко време- 
ни М$ РО$5 в диапазоне 0-—199:; иначе СЕ = 1 — АХ = код ошибки. 

Данная функция реализована в полном объеме. 


Установить дату последней модификации файла 
Вход: АХ = 5705Н; ВХ = дескриптор файла; СХ = 00001; ОХ = биты установлены 
следующим образом: 0—4 = день месяца в диапазоне 1-31; 5-8 = месяц в диа- 
пазоне 1-12; 9-15 = число лет начиная с 1980 года. 
Выход: СЕ = 0 — успешное выполнение функции; СЕ = 1 — АХ = код ошибки. 
Аналогично функции 57041, данная функция позволяет установить только дату 
создания файла. 


Установить дату и время создания 

или последней модификации файла 

Вход: АХ = 5707Н; ВХ = дескриптор файла; СХ = биты установлены следующим обра- 
зом: 0—4 = секунды, деленные на 2; 5-10 = минуты (0-59); 11-15 = часы; ОХ = биты 
установлены следующим образом: 0—4 = день месяца в диапазоне 1-31; 5—8 = ме- 
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сяц в диапазоне 1—12; 9-15 = число лет начиная с 1980 года; $1 = двоичное значе- 
ние количества десятимиллисекундных интервалов, добавляемых к времени М5 
РО$ в диапазоне 090—199. 

Выход: СЕ = 0 — успешное выполнение функции; СЁ = 1 — АХ = код ощибки. 

Данная функция реализована в полном объеме. 

Кроме дополнительных функций, для работы с различными временными ха- 
рактеристиками файла УЛп4о\з-версия М$ 2О$ содержит две функции для пре- 
образования форматов времени. Дело в том, что \/1п4о\5 работает со временем 
в 64-разрядном формате. При этом точкой отсчета является 00 часов 00 минут 1 ян- 
варя 1901 года. Значение времени содержит число стонаносекундных интервалов, 
прошедших с этой даты. По расчетам разработчиков, этого значения должно хва- 
тить на 400 лет. Для того чтобы представить его в виде, воспринимаемом челове- 
ком (ОО5-время), введена функция 71а7Н. 

Вход: АХ = 71а7 1; ВЁ = 0 — преобразовать 64-разрядное время в ООЗ-время; 
05:51 = указатель на экземпляр структуры ЕШЕТМЕ, содержащей 64-битовое значе- 
ние времени. 

Выход: СЕ = 0 — успешное выполнение функции, при этом регистры устанавли- 
ваются следующим образом: ВН = число десятимиллисекундных интервалов, до- 
бавляемых к времени М$ РО$ (значение в диапазоне 0199); СХ = время в упако- 
ванном формате со значением битов: 0—4 — секунды, деленные на 2; 5-10 — минуты 
в диапазоне 0-59; 0—4 — часы в диапазоне 0—23; ОХ = дата в упакованном формате 
со значением битов: 0—4 — день месяца в диапазоне 1-31; 5—8 — месяц в диапазоне 
1-12; 9-15 — число лет начиная с 1980 года (для получения истинного значения 
прибавьте 1980); иначе СЕ = 1 — АХ = код ошибки. 

Структура НЕЕТМЕ описывается в программе следующим образом: 


РЕТШМЕ $гис 
Бы омдатет1те @4 ? : младшие 32 бита значения времени 
Оинтопбатеттте 4 й ; старшие 32 бита значения времени 
ЕЕТМЕ епд5 


Вход: АХ = 71а7Н; ВЕ = 1 — преобразовать РО5-время в 64-разрядное время; ВН = 
число десятимиллисекундных интервалов, добавляемых ко времени М$ ООЗ (зна- 
чение в диапазоне 0-199); СХ = время в упакованном формате со значением битов: 
0—4 — секунды, деленные на 2; 5-10 — минуты в диапазоне 0-59; 0—4 — часы в ди- 
апазоне 0—23; ОХ = дата в упакованном формате со значением битов: 0—4 — день 
месяца в диапазоне 1—31; 5—8 — месяц в диапазоне 1-12; 9-15 — число лет начи- 
ная с 1980 года (для получения истинного значения прибавьте 1980); 05:51 = ука- 
затель на экземпляр структуры ЕЕЕМЕ, в которой вернется 64-битовое значение 
времени. 

Выход: СЕ = 0 — успешное выполнение функции, при этом в области памяти, 
адресуемой 05:51, возвращается 64-битовое значение времени; СЕ = 1 — АХ = код 
ошибки. 


Получить атрибуты файла 
Вход: 

" АХ= 71438; 

” ВХ = действие: 
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С 0О— получить атрибуты, на выходе СХ = атрибуты файла: 0000Н — файл дос- 
тупен по записи и чтению; 00018 — файл доступен по чтению; 00021 — скры- 
тый файл; 00041 — системный файл; 00081 — метка тома; 00101 — каталог; 
0020[ — архивный файл; 

о 2— получить размер сжатого файла — на выходе ОХ:АХ = размер сжатого 
файла в байтах на диске; 

С 4 — получить дату и время последней записи — на выходе: СХ - время в фор- 
мате: 0—4 — секунды, деленные на 2; 5-10 = минуты (0-59); 11-15 = часы 
(0—23); 01 = дата в формате: 0—4 = день месяца (1-31); 5—8 — месяц (1-12); 
9-15 = число летс 1980 года; 

С 6б— получить дату последнего доступа — на выходе: 0] = дата (см. ВХ = 4); 

С 8 — получить дату и время создания — на выходе: СХ = время в формате, 01 — 
= форматированная дата (см. ВХ = 4), $1 = двоичное значение количества де- 
сятимиллисекундных интервалов, добавляемых ко времени М$ РОЗ в диз- 
пазоне 0-—199; 

05:0Х — АЗСИ7-строка с именем (путем) файла. 

Выход: СЕ = 0 в случас успеха, информация в регистрах определяется значени- 

ем ВХ на входе (см. выше): АХ = код ошибки (СЁ =1): 1 — неверное значениев А; 
2 — файл не найден; 3 — несуществующий путь; 5 — доступ запрещен. 


Установить атрибуты файла 
Вход: 

АХ = 71438; 

ВХ = действие: 

О 1 — установить атрибуты, на входе: СХ = атрибуты файла: 00001 — файл до- 
ступен по записи и чтению; 00011 — файл доступен по чтению; 00021 — скры- 
тый файл; 00048 — системный файл; 00208 — архивный файл; 

С 3— установить дату и время последней записи: СХ = время в формате: 0—4 = 
= секунды, деленные на 2; 5-10 = минуты (0-59); 11—15 = часы (0-23); 91 = 
= дата в формате: 0—4 = день месяца (1-31); 5—8 = месяц (1-12); 9-15 = чис- 
ло лет с 1980 года; 

С 5 — установить дату последнего доступа (см. ВХ = 3); 

О 7— установить дату и время создания: СХ = время (см. ВХ = 3), ОГ = дата 
(см. ВХ = 3), $1 = двоичное значение количества десятимиллисекундных ин- 
тервалов, добавляемых ко времени М$ ОО$ в диапазоне 0-199; 

05:0Х — А$СИ7-строка с именем (путем) файла. 

Выход: СЕ = 0 — СХ = слово атрибутов файла; СЕ = 1 — АХ = код ошибки: 1 — не- 

верное значение в АГ; 2 — файл не найден; 3 — несуществующий путь; 5 — доступ 
запрещен. 


Переименовать файл 


Вход: АН = 71561; 05:0Х — АЗСИЙ-имя существующего файла; Е5:01 — АЗСИЙ-имя 
нового файла; (1 = маска атрибутов. 
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Выход: СЕ = 0 — при успешном переименовании; СЁ = 1 — АХ = код ощибки: 2 — 
файл не найден; 3 — несуществующий путь; 5 — доступ запрещен; 118 — устрой- 
ства для старого и нового файлов не совпадают. 


Работа с дисками, каталогами 
и организация поиска файлов 


Получить информацию о томе 


Вход: АН = 71АОН; 05:0Х — адрес АЗСПЯ-строки с именем корневого каталога дис- 
ка, о котором необходимо получить информацию (С:\); Еб: ОТ — адрес буфера, в ко- 
торый будет помещена АЗСП7-строка с именем файловой системы; СХ = размер 
буфера, в который будет помещена АЗСПЯ-строка с именем файловой системы. 
Выход: СЕ = 0 — успешное выполнение, при эгом в буфер по адресу в Е5:01 поме- 
щается АЗСИЙ-строка с именем файловой системы и устанавливаются следую- 
щие регистры: ВХ = флаги файловой системы (комбинация значений: 0001Ъ — при 
поиске учитывается регистр букв в именах файлов; 00025 — файловая система 
сохраняет регистр букв в элементах каталога; 00046 — использование символов 
Итмсоде в именах каталогов и файлов; 40001 — файловая система поддерживает 
длинные имена файлов и функции для работы с ними; 80001 — том сжат); СХ = 
= максимально допустимая длина имени файла на данном томе без последнего нуле- 
вого символа (до 255); ОХ = максимально допустимая длина пути для данного тома, 
включая последний нулевой символ (до 260); иначе (Е = 1 — АХ = код ошибки. 


Создание каталога 

Вход: АН = 7139Н; 0$:0Х — адрес строки с АЗСИ7-именем существующего файла. 
Выход: СЕ = 0 — при успешном переименовании; СЕ — 1 — АХ = код ошибки: 3 — 

несуществующий путь; 5 — доступ запрещен. 


Удаление каталога 


Удаляемый каталог должен быть пуст. 

Вход: АН = 713ЗАН; 05:0Х — АЗСП7-строка пути к удаляемому каталогу. 

Выход: СЕ = 0 — АХ = не определен; СЕ = 1 — АХ = код ошибки: 3 — несуществую- 
щий путь; 5 — доступ запрещен; 101 — попытка удаления текущего каталога. 


Изменить текущий каталог 


Понятие текущего каталога аналогично тому, что приводилось выше при рассмот- 
рении функций для работы с файлами, имеющими короткие имена. 

Вход: АН = 713ВН; 05:0Х — указатель на буфер, содержащий полный путь от кор- 
невого каталога в виде АЗСИЙ-строки и в качестве последиего элемента включаю- 
щий имя нового текущего каталога (естественно, что допустимы длинные имена 
с ограничениями по максимальной длине (см. функцию 71а0П)). 

Выход: СЕ = 0 — АХне определен; СЕ = 0 — АХ = код ошибки: ОЗВ — путь не найден. 


Получение текущего каталога 


Вход: АН = 7147Н; ОЕ = номер устройства (008 — 1скущее (‘данное по умолчанию), 
011 — А: ит. д.); 05:51 — указатель на буфер для записи по итого пути от корневого 
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к текущему каталогу (длина буфера должна быть не менее длины, возвращаемой 
в регистре ОХ функцией 71а0В). 

Выход: СЕ = 0 — успешное выполнение функции, в результате чего полный путь 
от корневого каталога в виде АЗСП7-строки без имени диска и символа \ записы- 
вается в буфер, адрес которого указан в 05:51; либо АХ = кодошибки (СЕ = 1): ОЕ — 
недопустимый дисковод. 

Среди новых функций, работающих, в том числе, с длинными именами файлов, 
существует функция 71601, позволяющая получить полные пути для указанных фай- 
лов или относительных путей: получить полный путь (СХ = 0), получить полный путь 
с краткими именами (СХ = 1), получить полный путь с длинными именами (СХ = 2). 


Получить полный путь 
Вход: АН = 7160Н; СЕ = 0; СН — содержимое результата (СН = 80$ — получить имя 
диска; СН = 0 — получить полный путь); 05:51 — адрес АЗСП7-строки с именем 
файла или каталога, для которых запрашивается полный путь. Допускаются оба 
типа имен — длинные и короткие; Е5:01 — адрес строки, в которую нужно записать 
полный путь. Размер буфера должен быть достаточным для размещения пути мак- | 
симальной длины (функция 71а0П). 

Выход: СЕ = 0 — успешное выполнение функции, в результате чего полный путь | 
от корневого каталога в виде АЗСИ7-строки сохраняется в буфере, адрес которого 
а в Е5:0Т; или же СЕ = 1 — АХ = код ошибки. 


Программа: рг907_24.азт. Применение функции 7160и (С1=0) 
прерывания 21П для получения полного пути. 


аа 

1Тепате Ге 'Пу_РПе и1ЕИ 1079 пате.1хе’. 0 
ротиё_Тпате 94 {1 епате 

РаёиАЛ1 [61 260 дир (0) 


ро1пё_Раеи 94 РафиЕи1 
.с0де т” 


19$ 51. ротиЕ Тпате ; формируем указатель на имя файла 
Те$ 41. ро1пЕ Рафи :; формируем указатель на буфер 

: для полного пути 
оу ах. 71600 : номер функции 005 
тоу си. 801 :; СН = 801 -— получить имя диска 
оу с1. 0 : получить полный путь 


Данная функция работает очень примитивно — при указании имени файла или 
относительного пути (с символами <.» И <..>) она не проверяет его существование, 
алишь добавляет к нему имя текущего диска и каталога. Поэтому при использова- 
нии этой функции требуются другие средства, позволяющие контролировать ре- 
альное наличие файла или пути на диске. 


Получить полный путь с краткими именами 

(в формате 8.3) 

Вход: АН = 71601; (1. = 1; СН — содержимое результата (СН = 801 — получить имя 
диска; СН = 0 — получить полный путь); 05:51 — адрес АЗСИЙ-строки с именем 
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файла или каталога, для которых запрашивается путь в короткой форме. Допуска- 
ются оба типа имен — длинные и короткие; Е5:01 — адрес строки, в которую требу- 
ется записать полный путь. Размер буфера должен быть достаточным для разме- 
щения пути максимальной длины (функция 71а0Н). 

Выход: СЕ = 0 — успешное выполнение функции, в результате чего полный путь 
от корневого каталога в виде АЗСП7-строки оказывается в буфере, адрес которого 
у в Е5: ОТ; СЕ = 1 — АХ = код ошибки. 


:] Программа: рг907_25.азт. Применение функции 71600 (СЕ=1) прерывания 21и 
я для получения полного пути с краткими именами (в формате 8.3}. ] 


ен кеене-е--н---- + 
даа 

{1 1епате [61° 'Пу Ре м1 1019 пате.+хе’. 0 

рот" _Рпате ва +1 1епате 

Раёирл1 [619] 260 дир (0) 


ротпё_Ра{и [ее РафИЕил1 
.соае ый 
145. $1. роте Гпате ; формируем указатель на имя файла 


1е5 91. ротиё Рай :; формируем указатель на буфер 
: ДлЯ ПОЛНОГО пути 


оу ах. 7160И ; номер функции 00$ 

ОУ сп. 800 ; СН = 801 -— получить имя диска 

оу ст : полный путь с краткими именами . 
1 21й 

< ех1+ 


На выходе функция формирует строку, содержащую полный путь, причем все 
длинные компоненты этого пути заменяются их краткими псевдонимами, удов- 
летворяющими схеме «8.3». Данный вариант функции (при СЕ = 1), в отличие отее 
предыдущего варианта, производит проверку наличия файла или пути. 


Получить полный путь с длинными именами 


Вход: АН = 7160Н; СЁ = 2; СН — содержимое результата (СН = 801 — получить имя 
диска; СН = 0 — получить полный путь); 05:51 — адрес АЗСИ7-строки с именем 
файла или каталога, для которых запрашивается путь в длинной форме. Допуска- 
ются оба типа имен — длинные и короткие; Е5:0Т — адрес строки, в которую следу- 
ет записать полный путь. Размер буфера должен быть достаточным для номеще- 
ния пути максимальной длины (функция 71а0П). 

Выход: СЕ = 0 — успешное выполнение функции, в результате чего полный пугь 
от корневого каталога в виде АЗСИЙ-строки попадает в буфер, адрес которого ука- 
зан в Е$:0Т; СЕ = 1 — АХ = код ошибки. 


Получить информацию о файле по описателю 


Вход: АН = 71АбН; флаг СЕ = 1; ВХ = дескриптор файла; 0$:0Х — адрес структуры 
В\_НАМОЦЕ_ЕТЕЕ_ТМЕОВМАТТОМ. 
Выход: СЁ = 0 — успешное выполнение функции; СЁ = 1 — АХ = код ошибки. 
Формат структуры В\_НАМОЕЕ_ЕТЕЕ_ТМЕОВМАТТОМ приведен ниже. 


ВУ НАМОЕЕ_ЕТЬЕ_ТМЕОВМАТТОМ $Егис 
Чт ТедЕег1ЬиЕе$ а ? 
ЕСгеаТопТ1те 994 2 9р(?) 
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ЕЕГа${Ассе$$Т1те 99 2 9р(?) 


аз игтфет1те 99 2 9\р(?) 
Чм\о1итебегта1Митбег 94 ? 
п 1ет2еН1аи 94а ? 
п#1165126е.0м аа ? 
ппитего Я 1ик$ 99 ? 
пе еТидехН1ай 99 ? 
пр епаехом аа ? 


ВУ _НАМОЕЕ ЕТЕЕ ТМЕОВМАТТОМ еп 
Поля этой структуры описаны в следующей таблице. 


Поле пива 


а\“ЕПедАетЬще$ Атрибуты файла. Этот элемент может быть комбинацией 
следующих значений: 
ЕП.Е_АТТЮМВОТЕ_МОКВМА!. (000000001) — файл 
доступен по чтению и записи; этот атрибут нельзя 
комбинировать с другими; 
ЕИ.Е_ АТТЮВОТЕ_ВЕАООМТУ (00000001н) — файл 
только для чтения; 
ЕЦ.Е_АТТЕВОТЕ_НООЕМ (000000021) — скрытый 
файл; 
ЕП.Е_АТТЕНВОТЕ_$ЗУЗТЕМ (000000041) — системный 
файл; 
ЕПЕ_АТТЕЩВОТЕ_Г/ВЕСТОВУ (00000010) -— каталог; 
ЕШЕ_АТТЮВОТЕ_АКСТШУЕ (00000020Н) — архивный 
файл 


ММитБегОЙ лтК$ Число связей с данным файлом. В файловых системах ЕАТ 
и НРЕ$ этот элемент всегда равен 1. В файловой системе 
МТЕЗ число связей может превышать 1 


МЕЙетаех НВ Старшее слово уникального дескриитора, связанного 
с файлом 


МЕШетаех{Т.о\/ Младшее слово уникального дескриптора, связанного 
с файлом. Файл однозначно определяется дескриптором 
и серийным номером тома 




























Я Программа: рг907_26.азт. Применение функции 71Аби прерывания 211 | 
7] для получения информации о файле по описателю. ] 


БУ НАМОСЕ_РТСЕ_ТМЕОВМАТТОМ $%гис 
ОЕ 1 1едЕЕгтрифе$ 99 ? 

РЕСгеа 1опТ1те 99 2 94р(?) 
РЕ аз Ассез$Тчте 994 2 ар(2) 
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РЕ азигтет1те 99 2 91р(?) 
БимоТитебегла]Митбег 99 ? 
МЕ1Те517еН1оп 99 ? 
№11е$126.0м да ? 
№итьегО Я 7ик$ а ? 
МЕ Те] идехН1 аи а ? 
МЕ еГпдехом 99 ? 


ВУ НАМОЕЕ _РТЕЕ ТМЕОВМАТТОМ еп05 


„даа 


Ге лиГо_ ВУ _НАМЕ ЕЩЕ ТМЕОВМАТТОМ <> 


ротпё_Р1иа_ 
1] епате 


ротиё_Тпате 
нап] е 


.соде 


гереа* : 


т]: 


09 те ли о_ 

[6] "ту Те ии 1019 пате. 1х‘. 0 ; файл. о котором 
; будем а информацию 

[# {1 1епате 


м0 


открываем файл 
ЮУ Ьх. 0100/+04001 ; не использовать буферизацию + 
; содержимое ОТ в псевдоним 


оу ах. 1 ; открыть файл. если он существует. 
: иначе вернуть ошибку 
14$ $1. ро?пё_фпате ; формируем указатель на имя файла 
поу 91. 7 : добавить в конец псевдонима символ 7 
оу ах. 716сп : номер функции 00$ 
хог сх. сх ; атрибуты файла — обычный файл — 
: доступ для чтения-записи 
ия 2] 
З0с м1 ; @Сли файл существовал. то переход 
тоу ах. 101 : создать файл 
З7р гереа* ; переход — повторим открытие файла 
действия при успешном открытии файла 
поу Нап Те. ах ; сохраним дескриптор файла 
получаем информацию о файле 
оу Ьх. Нате 
5 ; это обязательно 


19$ 9х. ро1пё_11"9_ : формируем указатель на структуру 
: ВУ НАМОЕЕ РТШЕ_ТМЕОВМАТТОМ 

Ще ах. 71]абп 

17% ан 

обрабатываем полученную информацию 


Создать псевдоним 


Функция 71АВН предназначена для генерации короткого (в формате 8.3) имени 
для заданного файла с длинным именем. 

Вход: АН = 71АВН; 05:51 — адрес строки (с нулевым символом в конце), содержа- 
щей длинное имя нужного файла без указания пути; Е5:01 — адрес буфера, в кото- 
ром возвращается псевдоним; ОН — формат псевдонима (0 — 11-символьное имя 
элемента каталога; 1 — имя файла в формате 8.3); ОЕ — набор символов для длин- 
ного имени и псевдонима. Это значение — упакованная величина в формате: биты 
0-3 — набор символов в исходном имени файла (0 — УЛп4о\з$ АМЗГ; 1 — ОЕМ; 
2— Опко4е); биты 4-7 — набор символов в создаваемом коротком имени (0 — 
\УЛпдо\м$ АМЗТ; 1 — ОЕМ; 2 — Чшсове). 

Выход: СЕ = 0 — успешное выполнение функции; СЕ = 1 — АХ = код ошибки. 
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| Программа: рг907_27.азт. Применение функции 71АВН прерывания 21П | 
для создания псевдонима. | 


"чата 

1Тепате 1019 ‘ту _111е мн Топд пате.$хё'. 0 
ротпё_пате_1оп9 @4 {1Тепате_10пд 

Е Тепате_5ПогЕ (6 11 @ир (20п) 

ро1пё_Гпате_Ногё 94 — ТИепате_$Поге 

Напо1е м 

.с04е 


---=-- открываем файл 
Ще Ьх. 01001+0400/ ; не использовать буферизацию + 
: содержимое ОТ в псевдоним 


оу 9х. 1 : открыть файл. если он существует. 
; иначе вернуть ошибку 
149$ 51. рот. Тпате 1019; формируем указатель на имя файла 
МОУ 91. : добавить в конец псевдонима символ 7 
гереа*: оу ах. бен : номер функции 00$ 
хог сх. сх ; атрибуты файла — обычный файл — 
: доступ для чтения-записи 
17% РА 
3пс м1 : если файл существовал. то переход 
ет 9х. 108 ; создать файл 
тр гереа+ ; переход — повторим открытие файла 
;------ действия при успешном открытии файла 
м1: Ще Папе. ах : Сохраним дескриптор файла 
;------ аи, и 
14$ ‚ ротпё_Гпате_10пд 
1е$ ‚ ройиЕ Рпате_5Ног& 
оу ей. 1 
оу 9. 0 
том ах. 71а8и 


10% 21и 


Действие данной функции несколько отличается от процесса формирования 
псевдонима файла операционной системой и заключается в том, что длинное имя 
попросту обрезается по границам «8.3». В этом несложно убедиться, проанализи- 
ровав работу приведенной выше программы в отладчике. 


Поиск файлов и каталогов 


В \/шдо\з-версии М$ ОО$ процесс поиска немного отличается от рассмотренно- 
го выше. Для этого используются три функции и структура МЛМ№З2_ЕТМО_ОАТА в па- 
мяти, в которой возвращается информация о файле. Для запуска процесса поиска 
вызывается функция 714еН — найти первый файл. 

Вход: АН = 714еН; (1 — атрибуты искомых файлов (00008 — файл доступен по 
записи и чтению; 00018 — файл доступен по чтению; 00021 — скрытый файл; 00048 — 
системный файл; 00081 — метка тома; 00104 — каталог; 00208 — архивный файл); 
СН — дополнительные атрибуты искомых файлов (00004 — файл доступен по за- 
писи и чтению; 00018 — файл доступен по чтению; 00021 — скрытый файл; 00048 — 
системный файл; 00088 — метка тома; 00101 — каталог; 00201 — архивный файл); 
05:0Х — адрес АЗСП7-строки с именем искомого файла или каталога. Допускают- 
ся оба типа имен — длинные и короткие. В именах допустимы символы шаблона * 
и ?; Е5:01 — адрес структуры \ММ№32_ЕМО_ОАТА, в которой будет возвращена инфор- 


— 
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мация о файле; $1 — формат, в котором возвращается дата и время (0 — дата и вре- 
мя в 64-разрядном формате; 1 — дата и время в формате М$ ОО5). 

Выход: СЕ = 0 — успешное выполнение функции, в результате в регистрах АХ 
и СХ оказывается следующая информация: АХ = дескриптор, использующийся да- 
лее для процесса поиска; СХ = возможные значения: 00001 — все символы структу- 
ры М1М32_ЕТ№О_ОАТА, составляющие основное и альтернативное имя файла, успеш- 
но преобразованы из Ошсоде; 00011 — основное имя, возвращенное в структуре 
МТМЗ2_Е1ТМО_ОАТА, содержит знаки подчеркивания на месте символов, не преобра- 
зованных из Отусоде; 0002Н — альтернативное имя, возвращенное в структуре 
МТМЗ2_Е1МО_ОАТА, со знаками подчеркивания на месте символов, не преобразован- 
ных из Опкоае; или СЕ = 1 — АХ = код ошибки при неудачном выполнении фун- 
кЦиИи. 

Вызов функции 714еН приводит к заполнению полей структуры \МММ32_ЕМ0_ 
ОАТА, после чего можно проанализировать ее поля. Основной интерес представля- 
ют поля основного (СеМате) и альтернативного (СаКетпаеР\еМате) имен. Их 
можно анализировать на предмет удовлетворения условиям поиска. Если необхо- 
димо продолжить поиск, вызывается функция 714 — найти следующий файл. 
Если же поиск считается удачным либо его необходимо прекратить, то вызывает- 
ся функция 71а1Н — прекратить поиск. Ниже описаны порядок вызова функций 
71411 и 71а1Н и формат структуры М1М№З2_ЕТМО_БАТА. 

Вход: АН = 7141; ВХ = дескриптор, полученный функцией 714еН; Е5:01 — адрес 
структуры М1 М32_ЕТМО_ОАТА, в которой будет возвращена информация о файле; $1 — 
формат, в котором возвращается дата и время (0 — дата и время в 64-разрядном 
формате; 1 — дата и время в формате М$ ОО5). 

Выход: СЕ = 0 — успешное выполнение функции, в результате в регистры АХ и 
СХ заносится следующая информация: СХ = возможные значения: 00008 — все сим- 
волы структуры \ММ32_Е1МО_ОАТА, составляющие основное и альтернативное имя 
файла, успешно преобразованы из Ошсоде; 00018 — основное имя, возвращенное 
в структуре МП№32_ЕМО_ОАТА, содержит знаки подчеркивания на месте символов, 
не преобразованных из От!соде; 00021 — альтернативное имя, возвращенное 
в структуре МЧМЗг_ЕНМО_ОАТА, со знаками подчеркивания на месте символов, не пре- 
образованных из Отисобе; иначе СЕ = 1 — АХ = код ошибки при неудачном выпол- 
нении функции. 

Функция 714ей, в отличие от аналогичных функций «старой» М$ ОО$, исполь- 
зует не область ОТА, а некоторый блок в памяти. Этот блок важно своевременно 
освобождать, для этого и предназначена функция 71а1П. 

Вход: АН = 71А1Н; ВХ = дескриптор, полученный функцией 714еН. 

Выход: СЕ = 0 — успешное выполнение функции; СЕ = 1 — АХ = код ошибки при 
неудачном выполнении функции. 

Ниже приведена структура \1№32_ЕМО_ОАТА, в которую в процессе поиска за- 
писывается информация о файлах. 


и1МЗ2 ЕТО АТА $&гис 
ОЕ Пед ге 99 ? 

Сгеа ТопТ1те 99 2 9ир(?) 
Е а$%Ассе$$Тлте 449 2 @р(?) 
Иа игиет1те 99 2 9ирс? ) 


№1 1е512еН19и 99 : размер файла в байтах (старшее слово) 
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№1 1е512е10м 94а ? : размер файла в байтах (младшее слово) 
ОмВезегуеб0 ва 0 : резерв 

ЧуВезегуед1 940 : резерв 

СЕТ еМате 96 МАХ РАТН дир(?) 


СА1фегпасеР11еМате Ч 14 4р(?) 
[32 _Е1МО ОАТА еп@5 


Поля этой структуры описаны в следующей таблице. 


[Поле | Описание 


4\ЕЦеАсетЬиез Атрибуты найденного файла (см. описание аналогичного 
элемента структуры ВУ_НАМОГЕ_ЕП.Е_ПМЕОКМАТТОМ) 


КСгеайопТите Время создания файла в одном из двух форматов: М5 ОО$ или 
64-разрядном, в зависимости от параметров, указанных 
при вызове функций 714еБ (найти первый файл) и 7141 
(найти следующий файл) 


ЕТ азАссез$Типе Время последнего доступа к файлу в одном из двух форматов: 
М$ ОО$5 или 64-разрядном, в зависимости от параметров, 
указанных при вызове функций 714ер и 7141 


ЕТаз\УгиеТите Время последней записи в файл в одном из двух форматов: 
М5 ОО$ или 64-разрядном, в зависимости от параметров, 
указанных при вызове функций 714сВ и 7141 


сЕ|еМате АЗСИ7-строка, содержащая имя файла. Размер строки должен 
быть не менее 256 символов 


сАЩегпавеЕИеМате | АЗСП7-строка, содержащая альтернативное имя файла 
в стандартном формате 8.3. Если элемент сЕПеМате содержит 
имя в формате 8.3 или файловая система не поддерживаст 
альтернативные имена в формате 8.3, то элемент 
сАегпакеРИеМате равен нулю 





Рассмотрим пример поиска файла по шаблону. Для этого предварительно со- 
здадим несколько файлов в соответствии с шаблоном Н(е_*.*. Среди этих файлов 
должен быть файл Не_05.6. В отладчике проследим за тем, как изменяется содер- 
жимое области памяти, отведенное для экземпляра структуры М1М№32_ЕТМО_ОАТА. 
Выход из программы — при обнаружении файла #е_5.4%6. 


| Программа: рг907_28.азт. Поиск файла по шаблону. 
еее еее = + 
иТАЗ2_Е1МО_ОАТА $гис 
ЧиЕТТеАЕ гие 94 ? 
ИСгеа 1опТ1те 99 2 @р(?) 
аз Ассе$$ те 094 2 4р(?) 
Тазигиетте 04 2 9р(?) 


М1 1е512еН1ой ва ? :; размер файла в байтах (старшее слово) 
М1 Тебтлеом 99 ? : размер файла в байтах (младшее слово) 
ОмВезегуе 0 99 0 ; резерв 

0мКезегуе 1 94а 0 ; резерв 

сЕ1ТеМате 9 МАХ_РАТН 9ир(?) 


САФегпаеЕ1ТеМате 46 14 дир(?) 
ИТМЗ2_Е1МО_БАТА епд$ 

„Дафа 

Нид_ №132 РТМ ОАТА <> 
ротиё_ Чиа 94 ппа_ 
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Т папе рафееги 46 "Пе *,*'. 0 
ро1пё_Г пате раффегп 44 Е пате ра беги 
ТП епате [819] 'ЕПе_05.&х6'. 0 ; искомый файл 
Теп_111епате = $ - ГПепате 
Нап] е Ом 0 
.собе 
ОУ с7. 0 ; атрибуты искомого файла 
оу си. 0 ; дополнительные атрибуты для поиска 
145 9х, ротпё_Т пате_раегп ; формируем указатель 
; на строку с шаблоном 
1е5 91, ротпё 11"9_ ; формируем указатель на экземпляр 
: структуры ИТМ№З2_ЕТМ№О_ ВАТА 
те ах. 714е! ; номер функции 00$ 
176 ан 
3с ех1 
1------ в ах был возвращен дескриптор — если нужно. то сохраним 
оу Нап Те, ах 
еннЕНя проверяем. тот ли это файл 
м: оу сх. 1еп_11Тепате 
Теа 41. ла .СГЛеМате 
Теа 51. ГИ епате 
гере стр$Ь 
А. ех1+ 
т----- продолжаем поиск — в Бх дескриптор. полученный от 714ей 
оу Ьх. папе 
1е5 91. ро1пё_Р1т9_ ; формируем указатель на зкземпляр 
; структуры И1М№32_ЕТМО_ОАТА 
ОУ ах. 7144И : номер функции 00$ 
хог $1. $1 ; формат даты 
17% ап 
пс м1 
ВЕЕР Е завершить поиск 
ех1{: [ет ах. 71а]й 
ОУ Ьх. папе 


Ти ан 

В отладчике хорошо видно, что выход из данной программы происходит в двух 
случаях: 

когда файл найден, выход из программы производится в результате сравнения 

командой СМР5В (флаг Е устанавливается в 1); 
” когда файлов, удовлетворяющих шаблону, нет, функция поиска 714ев или 7141 

завершается неудачей (флаг СЕ устанавливается в 1). 

В качестве шаблона можно задать символы *.*, тогда мы сумеем получить име- 
на и проанализировать все файлы в текущем каталоге. Это бывает полезным при 
программировании операции перемещения или копирования каталога. 


Остальные функции работы с файлами, предназначенные для записи/чтения/ 
позиционирования, остались прежними. 


Файловый ввод-вывод в \МИпт32 


В этом разделе будут представлены минимальные сведения, необходимые для 
выполнения простых операций с файлами. В отличие от М$ ОО$, среда \/т32 
способна поддерживать несколько файловых систем. Главные требования к этим 
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системам — иерархичность и соблюдение определенных правил присвоения имен 
каталогам и файлам. 

Перечислим функции АР \/ 1132, имеющие отношение к работе с файловой 
системой. Полное их описание можно найти в библиотеке МОМ. 


Пункция [Нана 
АгеЕРЛеАр5 АМ Определение набора символов файла — АМ! или ОЕМ 


СапсеПо Отменить все ждущие обработки операции ввода 
и вывода (1/О) 


С!озеНапе Закрыть открытый дескриптор файла 
СоруЕЙе, СоруЕНеЕх Копирование существующего файла в новый файл 


СоруРгоргезКои те Определенная приложением функция обратного вызова, 
используемая с функциями СоруЕЙйеЕх 

и МоуеРМе\/ и Ргоргезз. Она вызывается, когда 
завершается часть операции копирования или пересылки 


СгежеОнесвогу, Создать каталог 
СтгеатеПУгесогуЕх 
СгеабеРИе Создать файл или объект специального типа 
ПейпедозОеусе Определить, переопределить или удалить имена 
устройства М$ ОО$ 
рае ие 
ЕааСюзе Закрыть указанный поисковый дескриптор 
(см. функции ЕтаЕ 5 Ейе и ЕтЧ Мех Ее) 
ЕтаСюзеСвапееМоййсаНоп | Закрыть объект-уведомление об изменении файла 
ЕтаЕйзСрвапееМонйсайоп | Создать объект-уведомление об изменении файла 


ЕшаЕизЕЕЙе, ЕаАЕиз(ЕЦеЕх, | Поиск файлов 

ЕшаМехеЕЦе 

ЕшаМех(СпапяеМоййсаНоп | Сброс объекта-уведомления в занятое состояние 

НВ ЕЙеВийегз Очистка буфера для указанного файла и запись всех 
буферизированных данных в файл 

Се ВтагуТуре Определить, является ли файл исполняемым, и если это 


так, то для какой подсистемы — \\! 1132, М$ 2О$, О$/2, 
ОМХ (РОЗХ) ит. д. 


СееСигтеп Огесвогу Получить текущий каталог 

Се(5КЕгееЗрасе, Информация относительно указанного диска, включая 

Сео5КЕгееЗрасеЕх количество свободного пространства на нем 

СепуеТуре Определить тип диска — съемный, фиксированный, 
СО-КОМ, электронный или сетевой 

СеЕНеА т Ьиеез, Получить атрибуты файла или каталога 

СеЕЙеАетЬ ше Ех 


СеЕПейюгтайопВуНап е | Найти информацию относительно указанного файла 
























жж 





Файловый ввод-вывод в \Мт32 259 


СООО СООО 













Се Тозса О пуез, Определить доступные в настоящее время дисководы 
Се оса пуеЗитт8$ 


МоуеЕЙе, МоуеЕЙеЕх, Переименование файла 
МоуеЕЦе\/иНРгоргез$ Е 


ОцегудозОемсе Получить информацию об именах устройства М$ РОЗ 


КеааАОтестогуСВапяез \/ Получить информацию об изменениях в пределах 
каталога 


ВеадЕИе, ВезЕИсЕх 


ВеааЕЙе5са(ег Чтение данных из файла с сохранением их в наборе 
буферов 


КетоуеОнесюогу Удалить существующий пустой каталог 
ЗеагсБРаЕй Поиск указанного файла 
Зе СиггепЕГугесёогу Установить текущий каталог 


Зе ЕпаОЁЕЕИе Поместить символ конца файла (ЕОРЁ) в текущую 
позицию указателя 


Зе Е|еАрзТоАМ$Т Использовать кодовую страницу набора символов АМЗ 
при работе функций файлового ввода-вывода 


Зе ЕЙеАр5ТоОЕМ Использовать кодовую страницу набора символов ОЕМ 
при работе функций файлового ввода-вывода 
ЗесЕЙед г Ьиёс$ Установить атрибуты файла 


Зе ЕЙеРотеег, Переместить указатель в определенную позицию файла 
Зе ЕПеРониегЕх 


Зекуопитет ая 
роакЕИе, ОпоскЕЙеЕх 
МитвеЕИе, МутеЕИеЕх 


\/гцеЕИеСа!Шег Запись данных в файл из набора буферов 

















Далее на примерах конкретных программ разберемся с тем, как использовать 
в программах на ассемблере наиболее интересные и часто применяемые функции 
из перечисленных выше для работы с файлами АР! \Лп32. В целях экономии ме- 
ста все примеры реализованы в виде консольных приложений. Основное внима- 
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ние уделено не полноте описания параметров для вызова той или иной функции 
и результатов ее работы (эту информацию можно найти в справочниках по функ- 
циям АРГ), а деталям практической реализации файловых операций в программах 
на языке ассемблера. Для изучения подробностей работы функций АР] \/1т32 нам 
понадобится какой-либо отладчик для \/т4о\’5, например Т032.ЕХЕ. 


Обработка ошибок 


Прежде чем рассматривать функции АР] \/1132, относящиеся к файловому вво- 
ду-выводу, отметим, как можно выяснить причину их ошибочного завершения. Для 
этого УЛтдо\5 предоставляет функцию бе а$Еттог: 
ОМОКО Се а$Еггог (019): 

Внутрь функции беНазёЕгтгог не нужно передавать никаких параметров. Эту 
функцию следует вызывать сразу после вызова АР1 \/1п32, успешность работы 
которого мы проверяем. 


ризн ОРРзеф 1иГо 


ри$И Ее 
са11 бег еп огта{топВУНап]е 
са11 бей а$Еггог ; в регистре ЕАХ — код ошибки 


Врегистре ЕАХ возвращается код ошибки. Расшифровать его можно с помощью 
файла \МИпетог.Н, где вместе с кодами ошибок приведены короткие сообщения о при- 
чине их возникновения. 


Создание, открытие, закрытие и удаление файла 


Создание и открытие файла в \/1132 производится одной функцией Сгезе Те. 


НАМОСЕ Сгеафег11е((.РСТУТВ 1рЕ11еМате. ОмОВО 9мОез1гедАссез$. 
ОМОВО ОмбПагеМмоде. (РУЕСИВТТУ АТТЕТВИТЕ$ 1рбесиг Фуд г1Биеез. 
ОМОКО @иСгеаЕ1от01 $ ги оп. ОМОКО ОмЕ1 ад$АпдАЕ г1Бие$. 
НАМОСЕ ИТетр] афег1е): 


Параметры данной функции имеют размер двойного слова (4 байта). Их на- 
значение следующее (параметры описаны в порядке, обратном их заталкива- 
нию в стек): 

р”АеМате — указатель на АЗСИ7-строку с именем (путем) открываемого или 

создаваемого файла; 

м езтедАссез$ — тип доступа к файлу: 

с СбЕМЕВТС_ВЕАО = 80000000% — доступ по чтению; 

С бЕМЕВТС_МЕВПТЕ = 400000001 — доступ по записи; 

О бЕМЕВТС_ВЕАО + СЕМЕВТС_М/КТЕ = 0С00000001 — доступ по чтению-записи; 

Чм5ВагеМофе — режим разделения файлов между разными процессами, данный 

параметр может принимать значения: 

О О— монополизация доступа к файлу; 


О ЕЕ $НАВЕ_ВЕАО = 000000018 — другие процессы могут открыть файл, нотолько 
по чтению, запись в файл монополизирована процессом, открывшим файл; 


О ЕЕ _$НАВЕ МЕНЕ = 000000026 — другие процессы могут открыть файл, но толь- 
ко по записи, чтение в файл монополизировано процессом, открывшим файл; 


| 
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ЕЕЕ_ЗНАКЕ_КВЕАО + ЕЕ $НАВЕ_МЕТЕ = 000000031 — другие процессы могут 
открывать файл по чтению-записи; 


{рбесиТуАЕЧЬще$ — указатель на структуру $есш Му_АНиЬиве$ (файл мипБазе.В), 
определяющую защиту связанного с файлом объекта ядра, при отсутствии за- 
щиты заносится МИЦ; 

Чи/СтеаНот Ей БиНоп — определяет действия для случаев, когда файл существует 
или не существует (аналог этого параметра используется при вызове описан- 
ных выше функций М$ ОО$ 6сп и 716сп), данный параметр принимает зна- 


чения: 

С СКЕАТЕ_МЕМ/ = 1 — создать новый файл, если файл не существует; если файл 
существует, то функция завершается формированием ошибки; 

С СКВЕАТЕ_АНМАУ$ = 2 — создать новый файл, если файл не существует; если он 
существует, то заместить новым; 

С ОРЕМ_ЕХТ5Т1Мб = 3 — открыть файл, если он существует; если файл не суще- 
ствует, формируется ошибка; 

С ОРЕМ_АШМАУ$ = 4 — открыть файл при его существовании и создать его, если 
файла нет; 

О ТВОМСАТЕ ЕХТЗТТ№ 6 = 5 — открыть файл с усечением его до нулевой длины; 


если файл не существует, то вырабатывается ошибка; 


Чи НадзАпдАктЬие$ — флаги и атрибуты; этот параметр используется для зада- 
ния характеристик создаваемого файла: 


о АТЕ АТТЕТВОТЕ_КЕАБОМУ = 000000011 — файл только для чтения; 


ооооо 


О 


ЕЫЕ_АТТЕТВОТЕ_НТООЕМ = 000000026 — скрытый файл; 
ЕЦЕ_АТТЕТВОТЕ_$У$ТЕМ = 000000046 — системный файл; 
ЕЕЕ_АГТЕТВОТЕ_ОТКЕСТОКУ = 000000101 — каталог; 

НЕЕ _АТТЕ1ВУТЕ_АВСНТУЕ = 000000201 — архивный файл; 
ЕТЕЕ_АТТЕТВУОТЕ_МОКМАЕ = 00000080Ъ — обычный файл для чтения-записи 
(этот атрибут нельзя комбинировать с другими); 
ЕЕЕ_АТТЕТВОТЕ_ТЕМРОКАКУ = 000001001 — создается временный файл (пре- 
имущество которого в том, что система стремится не записывать этот файл 
на диск, а работает с ним в памяти; данный атрибут выгодно комбинировать 
с флагом ЕЕЕ_ЕЁАб_ОБЕГЕТЕ_ОМ_С1.05$Е, тогда после закрытия файла в програм- 
меон будет удален, не оставив следов на диске, иначе, каки в М$ ОО$, про- 
грамме придется «подчищать» за собой содержимое диска); 
ЕЕЕ_РЕАб_МЕТЕ_ТНКОЦСН = 800000008 — не использовать промежуточное 
кэширование при записи на диск, а все изменения сбрасывать прямо на диск; 
ЕТЕЕ_ЕЕАб_МО_ВИЕРЕВТМб = 20000000} — не использовать средства буфериза- 
ции операционной системы; 

ЕЕЕ_ЕТАб_ВАМООМ_АССЕ$$ = 100000006 — прямой доступ к файлу (установ- 
ка этого флага или флага НЕЕ_Р-Аб_$ЕСЦЕМТТАГ_5САМ позволяет оптимизи- 
ровать системой процесс кэширования); 
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о ЕЕ _АЛб_$ЕСЦЕМТТАЕ_5САМ = 080000006 — последовательный доступ к файлу; 

о РЕ ААб_ОЕТЕТЕ_ОМ_С1.0$Е = 040000006 — удалить файл после его закрытия 
(см. описание атрибута ЕИ.Е_АТТЕТВИТЕ_ТЕМРОВАКУ); 

о Е\Е_АЛАб_ОУЕВЕАРРЕВ = 400000008 — асинхронный доступ к файлу (синхрон- 
ность означает то, что программа, вызвавшая функцию для доступа к файлу, 
приостанавливается до тех пор, пока не закончит работу функция ввода- 
вывода); 

КТетр(авеР(е — параметр используется только при создании нового файла, его 

значением является дескриптор другого существующего и предварительно от- 

крытого файла, а новый файл создается с теми же значениями атрибутов и фла- 
гов, что и у файла, дескриптор которого указан в параметре НТетрИа{еЕЦе. 

При успешном завершении функция возвращает в регистре ЕАХ дескриптор 

нового файла. В случае неудачи функция заносит в регистр ЕАХ значение МИЦ. 


Закрытие файла 
Закрытие файла производится функцией (оеНап@е: 
ВОО СТозеНапФТе( НАМОГЕ ИОБЗесе ›:; 

Функция имеет один параметр размером в двойное слово — дескриптор, полу- 
ченный при открытии файла функцией СтеавеРе. 

При удачном завершении функция возвращает ненулевое значение в регистре 
ЕАХ. В случае неудачи функция возвращает в регистре ЕАХ значение МИЦ. 

\М/1т32 поддерживает несколько функций для часто используемых операций 
над файлами: копирование, перемещение и переименование файлов. 


Копирование файла 
Для копирования файлов в \/ 1132 используется функция СоруЕе: 
ВОС Соруг11е(ЕРСТ$ТВ ТрЕх1$1п9Е11еМате. [РСТЗТВ ТрМемЕ11еМате, ВОО БРа1111Ех1${$); 
Параметрами этой функции являются: 
([рЕх15таР(еМате — указатель на АЗСИЙ-строку с именем файла-источника; 
(рМемРЦеМате — указатель на АЗСП7-строку с именем файла-приемника, кото- 
рый может и не существовать; 
 БРаЙНЕх 5 — параметр, задаваемый равным 0 или 1, в зависимости от условий 
копирования: 
С 0О— при наличии файла он удаляется и создается новый с содержимым фай- 
ла-источника; 
О 1 — при наличии файла копирование не производится, а функция СоруРЙе 
возвращает ошибку. 
При удачном завершении функция возвращает ненулевое значение в регистре 
ЕАХ. В случае неудачи функция возвращает в регистре ЕАХ значение МИ. 


Программа: рг907_29.азт. и1п32-программа консольного приложения для ] 
исследования работы функции СоруЕ11е АРТ 1п32. 


"ата 
1 ПетехЕ [4 ‘Копирование файлов в И1п32'. 0 


| 


> 
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5_Ге [и "р". 0 :; имя входного файла 
9 #11е фе!) "р1". 0 : имя выходного файла 
.соде 

том еах. 1 

ризи  еах 


ризн — оТР5её а ТПе 
ри$й оТРзеё 5_Г71е 
са11 СоруЕ1ТеА 


стр еах. 0 
32 ех1е ; выход в случае неудачи 
Перемещение файла 


Для перемещения файла У шт32 предусматривает две функции — Мое Ре и МоуеЕИеЁх: 


ВООЕ томе[11е(ЕРСТЗТВ ТрЕх1$Е1пдЕ11еМате. (РСТЗТВ. 1р№емЕ11еМат) ; 
ВОО томе[11еЕх(ЕРСТЗТА ТрЕх15Е1п9Е11еМате. 1РСТУТК 1р\ем-1еМате. ОмОКО @мЕ1ад$); 


Параметрами функции МоуеШе являются указатели на АЗСИ7-строки с име- 
нами файла-источника и файла назначения. Функция МоуеРЦеЁх обладает допол- 
нительными свойствами благодаря наличию третьего параметра, который опреде- 
ляет особенности перемещения: 

МОМЕНТЕ _ВЕРЕАСЕ_ЕХТ$Т1Мб = 000000016 — при существовании целевого файла 

он замещается содержимым файла-источника; 

» МОМЕНТЕ _СОРУ_АНОМЕС = 000000026 — если не указывать специально, то функ- 
ция МоуеЕЦеЕХ не перемещает файлы на другой диск, аесли перемещение требу- 
ется, необходимо устанавливать этот флаг; 

МОМЕРТЕ_ОЕГАУ_УМТИ_ВЕВООТ = 000000048 (только для УЛт4до\5 МТ ивыше) — 

файл-источник не удаляется до перезагрузки системы; 

МО\ЕРТЕЕ М/ВТТЕ_ТНВОУСН = 00000008Ь — установка флага гарантирует, что 

возврат из функции не произойдет до фактического перемещения и удале- 

ния файла. 

Кроме этого, функция МоуеРЦеЕх допускает указание на месте второго парамет- 
ра значения МУ, тем самым моделируя вызов функции беее[Це. 

При успешном завершении функции Моуе[Це и МоуеРЦеЕх возвращают ненуле- 
вое значение в регистре ЕАХ. В случае неудачи функции помещают в регистр ЕАХ 
значение МИЦ. 


:| Программа: рг907_30.азт. и1и32-программа консольного приложения для | 
исспедования работы функции тоуеЕ11е(Ех) АРГ ИЧи32. | 


"ата 

71 етехЕ [6 ‘Перемещение файлов в Итп32'. 0 

5 Те [1 "р". 0 : имя входного файла 
а те {1 “р1". 0 : имя выходного файла 
.соде 


ризи  ОРРер а ТПе 

ризи озер $ Ре 

са11 почеЕ11еА 

стр вах. 0 

32 ех1ё : выход в случае неудачи 
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Переименование файла 


Специальной функции для переименования файла нет, так как она и не нужна — 
перемещение файла в пределах одного каталога по сути и является его переимено- 
ванием. 


Удаление файла 


Для удаления файла применяется функция Беее[(е: 
В00 Пе1ефеР\1е(ЕРСТЗТВ 1рЕ11еМате); 

У нее единственный параметр — указатель на АЗСИ7-строку с именем (путем) 
удаляемого файла. Перед удалением файл необходимо закрыть, хотя в некоторых 
версиях У/тдо\:з это не является обязательным. 

При успешном завершении функция возвращает ненулевое значение в регист- 
ре ЕАХ. В случае неудачи функция заносит в регистр ЕАХ значение МИЦ. 


Чтение, запись, позиционирование в файле 


Необходимо сразу отметить, что \/ 1132 допускает два режима доступа к файлу — 
синхронный и асинхронный. Необходимость введения этих двух режимов в архи- 
тектуру \/ 132 обусловлена тем, что файловый ввод-вывод относится к наиболее 
медленным операциям и способен значительно ухудигить впечатление от компью- 
тера с хорошей центральной частью (процессором и материнской платой) и пло- 
хой дисковой подсистемой. Поэтому разработчики \/т32 уделяют много внима- 
ния моделированию файловых операций с использованием памяти компьютера. 
Это и упомянутые выше временные файлы и гибкая система кэширования вводи- 
мых и выводимых данных, а также файлы, отображаемые в память, работу с кото- 
рымимы рассмотрим в конце данного раздела. Наше дальнейшее изложение будет 
посвящено организации синхронного ввода-вывода. Для обычных несложных при- 
ложений \/т32 его вполне достаточно. 


Установка текущей файловой позиции 


Доступ к содержимому файла может быть произвольным (прямым) и последова- 
тельным. Как обычно, функции ввода-вывода работают с файловым указателем. 
Но необходимо иметь в виду, что файловый указатель связан только с описателем 
файла. Его значение равно текущему номеру позиции в файле, с которой будет 
производиться чтение-запись данных при очередном вызове функции ввода-вы- 
вода. В первый момент после открытия значение указателя равно 0, то есть он ус- 
тановлен на начало файла. Функции, производящие чтение-запись в файле, меня- 
ют значение указателя на количество прочитанных или записанных байтов. При 
необходимости — а при организации прямого доступа кфайлу без этого необойтись — 
значение файлового указателя можно изменять с помощью функции 5еРеРоттёег: 


ОмОКО Зеер1ТеРотиёег( НАМОЕЕ ИР11е, ЕО№ 1015апсеТоМоме. РОМ Тро1$ЕапсеТоМомеН1ай, 
ОиОВО диМоуеМефпоч ): 


Параметры этой функции имеют размер двойного слова и следующее назначение: 
НРИе — дескриптор файла, в котором производится позиционирование указате- 
ля позиции (предполагается, что этот дескриптор был заранее получен функ- 
цией Стеа{ег\Це); 


> 
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1Ю15фапсеТоМоуе — расстояние в байтах, на которое необходимо переместить ука- 
затель; это число может трактоваться как знаковое и беззнаковое (см. 9мМоуе- 
Мео4) — его отрицательное значение соответствует случаю, когда указатель 
требуется перемещать к началу файла; 

*_ (роапсеТоМоуе Мак — если 32-битового значения, позволяющего определить 
знаковую величину 2 Гбайт, в {01$ апсеТоМоуе недостаточно, то для создания 64- 
битового знакового значения указателя позиции используют поле {рО1апсеТо- 
МочеНТан, представляющее собой указатель на 32-битовую переменную, значение 
которой будет являться значением старших 32 битов 64-разрядного указателя 
позиции; 

ЧмМоуеМе{Ро4 — параметр определяет то, каким образом правильно трактовать 
значения в паре, определяемой значениями (рО1$апсеТоМоуе ав и (01$апсе- 
ТоМоуе: 


о АЕ _ВЕСМ = 0 — указатель позиции — значение без знака, заданное содер- 
жимым полей {р01${апсеТоМоуе Тай и (01${апсеТоМоуе; 


о ЕИЕ_СУВВЕМТ = 1 — текущее значение указателя позиции складывается со 
знаковым значением, заданным содержимым полей (р0Я$апсеТоМоуе ан 
и [01$ апсеТоМоуе; 

о ЕТЕ_ЕЮ = 2 — в этом случае значение, определяемое содержимым полей 
рИ<апсеТоМоуеН1аВ и 1015{апсеТоМоуе, должно представлять собой отрица- 
тельное значение, и смещение в файле вычисляется как сумма, в которой 
первое слагаемое определяется \01${апсеТоМоуе или ([р015{апсеТоМоуеН1таН 
и (015фапсеТоМоуе, а второе является размером файла. 


Функция Зе РЦеРойтщег возвращает значение новой позиции указателя. Но при 
этом необходимо учитывать значение 1р015апсеТоМомен1дВ на входе: если оно ну- 
левое, то $еР\еРотёег заверигилась успешно; если [рб1${апсеТоМоуеН1аН было нену- 
левым, то считается, что функция возвращает в регистре ЕАХ младшие 32 бита но- 
вого значения указателя позиции, а его старшие 32 бита необходимо извлечь по 
адресу, заданному параметром \рО1апсеТоМоуеН1дН. В случае ошибки и при усло- 
вии (рО15ЕапсеТоМоуеН1ан = 0 функция $е ЕЦеРо1и{ег возвращает ЕАХ = ОНТ. 

Если вы внимательно изучали материал раздела, посвященный функциям М$ 
005, то наверняка заметили много общего, за исключением, пожалуй, одной дета- 
ли. Функция позиционирования М$ ОО$ 421 позволяла устанавливать указатель 
позиции за концом файла. Последующая операция записи в файл приводила к его 
расширению. В У 1132 для расширения (и, наоборот, уменьшения) файла суще- 
ствует отдельная функция 5е Еп4 0 Це: 

ВОО ЗеёЕпаОТЕ11е( НАМОБЕ ИРЛТе ); 
Алгоритм ее применения следующий. 


1. Спомощью функции $е РНеРой\ег позиционировать указатель на необходимую 
длину файла. 

2. Вызвать функцию $е{Еп Ч ОЁЕЦе, передав ей дескриптор файла, размер которого 
изменяется. 


3. Закрыть файл функцией (1о5еНапще. 
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При успешном завершении функция 5еЕпдОЁ Ще возвращает ненулевое значе- 
ние в регистре ЕАХ. В случае неудачи функция заносит в регистр ЕАХзначение МИЦ. 


Чтение и запись в файл 


Чтение и запись в файл производятся двумя функциями, Кеа@ Ее и Меце: 


ВООЕ ВеааЕ11е(НАМОЕЕ ПЕ11е. ЕРУОТО 1рВи{Рег, ОМОВО пМитьего{Вуте$ТоВеза, 
ЕРОМОКО ТрМитрегоТВуфе$Веаа. Г РОМЕКЕАРРЕО 1р0мег1арреа ): 

ВОО игтееЕ11е(НАЮОЕЕ ИЕ11Ле, ЕРСУОТО ТрВи{Рег. ОМОВО пМитьегОТВуее$Томгт{е. 
ЕРВОМОВО 1р\итьегОВусезиг1 ет, (РОМЕВЕАРРЕО ТрОмегТарред }›: 


Параметры этих функций означают следующее: 
ЮРИе — дескриптор файла, с которым производится операция чтения-записи; 


{рВиНег — указатель на буфер, где содержатся данные для операции чтения-за- 
писи; 


* пМитЬегОВуеТоКеа4 и пМитЬБегО!ВуеТо\/\е — число данных для чтения-записи; 


рМитЬегО!Вуте$Веа4 и (рМитЬегОВуеУпЕеп — указатель на буфер, в который 
записывается число действительно считанных или записанных байтов; 


’ [рОуеЦарред — указатель на структуру ОМЕВЕАРРЕО, используемую в процессе 
асинхронного ввода вывода (для синхронного режима — МИН.). 


При успешном завершении функции КеадЕР(е и УтиеР(е возвращают ненулевое 
значение в регистре ЕАХ. В случае неудачи функции заносят в регистр ЕАХ значе- 
ние МУШ. 

Выше не раз акцентировались возможности по кэшированию данных в процес- 
се текущего файлового ввода-вывода. Отметим в связи с функцией записи данных 
в файл еще одну полезную функцию — НизНЕ{еВиНегз, которая позволяет прину- 
дительно сбросить все буферизованные данные, соотнесенные с файлом, дескрип- 
тор которого указан в качестве входного параметра данной функции: 

ВООЕ ИТМАРТ ЕТиИЕ11еВиРег$ (НАМОЕЕ ВЕ11е); 

При успешном завершении функция Низ НЕИеВиНег$ возвращает ненулевое зна- 
чение в регистре ЕАХ. В случае неудачи функция заносит в регистр ЕАХ значение 
Ми. 

Для иллюстрации вышесказанного разработаем программу чтения содержимо- 
го файла и его построчного вывода на экран. Этот тренировочный пример позво- 
лит нам освоить основные операции для работы с файлом и его содержимым. Суть 
действий программы состоит в следующем. Имеется файл с кодом на языке ассем- 
блера — для большего интереса пусть это будет тот же самый файл, который со- 
держит эту программу. Необходимо разработать консольное приложение, которое 
выводит построчное содержимое этого файла на экран. 


: рг907_31.азт — И1и32-программа консольного приложения для исследования 
В работы с файлами на ассемблере — построчное чтение 
:| и вывод на экран содержимого файла. | 


еее нен------ + 
.аафа 

1рВит ОБ 260 дир (208} 

1рВиР512е=$-1рВи? 

1рМатеЕ11еТпВи? аа 0 

ЗАТ [6 "аут" 


Ире [ее 0 


[11е$12е 


Сол 
И етТехЕ 
99% 

Оп 
НапаНеад 
р_$агё 
Митиг1 
.соде 
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94 0 

Соога <> 

4 'Работа с файлами в и1п32', 0 

да 0 : дескриптор вывода консоли 

99 0 : дескриптор ввода консоли 

да 0: адрес кучи 

аа 0 : адрес блока для текста программы из общей кучи процесса 
99 0 : количество символов очередной строки. выведенной на экран 


текст окна заголовка 

ризН о115её Т1ТеТехе 

са11 5еЕСоп$о1ет1+1еА 

вывод строки текста; 

вначале получим дескрипторы ввода и вывода консоли 
риби $ТО_ОБТРИТ НАМОЕЕ 

са11 беезЕаНате 

ПОУ ООиё. еах : ВО\-дескриптор вывода консоли 
ризН УТО_1МРУТ_НАМОЕЕ 

са11 бес АНап Ле 

ПУ 91п. еах : А1п-дескрилптор ввода консоли 
установим курсор в позицию (2. 5) 


са11 5еЁСоп$о]еСиг$огРо$1Е10п 

стр еах. 0 

32 ех1ф ; если неуспех 

имя исходного файла программы получаем исходя 

из двух предположений: 

1. имя исходного файла совпадает с именем его 

исполняемого модуля 

2. оба файла расположены в одном каталоге 

НМООЦЕЕ бетМодиенапое(ЕРСТЗТВ 1рМоди1еМате); 

ри$Н 0 

са11 бе Моа еНап 1еА 

ОМОРО беемо@ЛеЕ1ТеМате(НМОСИСЕ ПМоале. ЕРТЗТВ 1рЕ11епате 
ОМОКО п512е); 

ри$в 1рВи{517е 

ризН ОТР5её 1ТрВиР 

ризН еах : дескриптор этого „.ехе-файла. 

; полученный бе Мод] еНапдЗе 

са11 бе{Моаи1е[11еМатеА 

в еах длина полного пути к исполняемому файлу 

(с расширением „ехе) 

Ще 1рМатег11еТиВит. еах 

для получения имени исходного файла заменим 
расширение „ехе на .а5т 


54 

Теа ез1, зАзтн2 
Теа ет. 1рВиР 
дес еах 

ада еб. еах 
ризв 95 

рор е5 

МОУ есх. 3 

гер моу$Ь 


открываем файл: 

НАЮОСЕ СгеафеЕ11е(ЕРСТЗТВ 1рЕ11еМате. ОМОВО @мОез1гедАссе$$. 
ОМОКО @мбпагеМоде, ЕРЗЕСУВТТУ АТТВТВИТЕ$ 
]7р5есиг ЕуАЕЕг1Биее$. ОМОКО диСгеаЕ3оп01$роз$1Е1оп, 
ОМОКО ОмЕТад$АпаАЕг1Ьиез. НАМОЦЕ ИТетр1афеР11е): 

рип 0 

ри$Н 0 ; атрибуты (они игнорируются) 

ризН ОРЕМ ЕХТЗТТМ@ —: открыть существующий файл. 
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СУСТ: 
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: если его нет — ошибка 
ризп 0 ; защита файла не требуется 
ризп ЕТЕЕ_ЗНАКЕ_КЕАО ; разрешено совместное использование 
; файла (по чтению) 
ризи  СЕМЕКГС ВЕАО ; разрешено чтение из файла 
ризп  оТРзеё ТрВиг 
са11 СгеабеЁР11еА 
стр вах. ОТРЕРЕЕЕЕ 
3е ех1ё ; если неуспех 
МОМ НЕ11е. еах : дескриптор файла 
определим размер файла: 
ОмОвО бееЕ11е$1ге(НАМОЕЕ ВЕ1Те, ЕРОМОКО 1рЕ11е$12енчон): 


рии 0 

рип ПЕ е 

са11 СефЕ11е517е 

стр еах. 0 

$2 ех1е ; если неуспех 

е) Е11е$12е. еах : сохраним размер файла 


выделяем блок в памяти. в который будем читать файл 

НапаНеа — адрес с описателем кучи 

используем кучу. выделяемую процессу по умолчанию 

НАМОЕЕ СефРгосез$Неар (\010): 

са11 бееРгосезНеар 

МОМ НапаНеаа. еах 

запрашиваем блок памяти из кучи: 

ГРУОТО НеарАТТос(НАМОЕЕ ИНеар. ОМОВО дмЕ1ад$. ОмОКО @мВуез): 
ризй [11е$12е 


рии 0 : флаги не задаем 

ри$Н НапаНеаа : дескриптор кучи 

са11 НеарА11ос 

оу р $Ёагё. еах ; адрес блока с текстом программы 


; из общей кучи процесса 
читаем файл: 
ВООЕ ВеадЕ11е(НАМОЕЕ ВЕ11е. 1РУОТО 1рВи Рег. 
О\Окр пМитрегО?ВуезТовеаа. (ГРОМОВ ТрМитьегОТВусе$Кеаа 
ЕРОМЕВЕАРРЕО ТрО\егТарреа) : 
ризп 0 
ризп оТРсер Е11е512е ; сколько байтов прочитано реально 
ризИ [11е$12е 


ризп р $ФагЕ : буфер. в который читаем файл 
рии НЕе 

са11 КеааЕ11е 

стр еах. 0 

ира ех1{ : если неуспех 


установим курсор в позицию (1. 5) 


са11 $еСоп5о1еСигзогРо$1Е1оп 


стр еах. 0 

Ау. ех1ё :; если неуспех 

теперь можно построчно и на экран 

с1а 

Де ед. р багё 

[Ще е51. р $Гагё 

оу есх. Е11е$12е 

пом а1, бай 

герпе  зсазЬ ;: в е$1 — адрес строки для вывода 
стр Бубе рёг [еа1], бай 

пе $-5 

тис ед1 

дес есх 

2 ех1ё ; весь файл прочитан 

оу еах, ед 

$46 еах. ез1 ; в еах — длина строки для вывода 


вывести очередную строку 
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са] Игл беСопо1еА 


стр еах. 0 

му. ех1 ; если неуспех 
ава’ е$1. еах 

Зир Сус] 


реа ееы закрываем файлы 
ех1{: :.-. 


При небольшой модификации программы можно построчно выводить содер- 
жимое любого текстового файла. Для небольших файлов совсем необязательно 
отслеживать конец каждой строки — проще выводить из буфера сразу весь файл 
одним вызовом функции МеСопзо[еА. 


Получение и изменение атрибутов файла 


Аналогично группе функций М$ ОО$ для работы с файловой системой, файловая 
подсистема \/1т32 содержит ряд функций, с помощью которых она позволяет опре- 
делить характеристики конкретного файла. 

Начальные значения атрибутов файла назначаются при создании файла. Впо- 
следствии их можно изменить вызовом функции 5еЕРИеАНиБшез: 
ВОО ЗеЕ11еАЕогтБите$ (ЕРСТЗТВ ТрЕ11еМате. ОмОвО @мЕ11еАЕглЬие$); 

Параметры этой функции означают следующее: 
* 1рЕ\еМате — указатель на АЗСИЙ-строку, содержащую имя файла; 


"” ауР(еАНиБиее$ — двойное слово, определяющее, какие атрибуты файла могут 
быть установлены. 


Планируя использование функции, необходимо иметь в виду, что не все воз- 
можные атрибуты файлов могут быть установлены с ее помошью. Перечислим те 
атрибуты, комбинацию которых допустимо задавать для изменения атрибутов 
файла, специфицированного параметром |рЕ|еМате: ЕТЕЕ_АТТЕТВОТЕ_АВСНТМЕ, Е.Е _ 
АГТЕТВИТЕ_НТООЕМ, ЕТЬЕ_АТТЕТВОТЕ_МОКВМАЕ, ЕТЕЕ_АТТЕТВИЫТЕ_ВЕАБОМУ, ЕТЕЕ_АТТЕ1- 
ВИТЕ_$\У5ТЕМ, ЕТЬЕ_АТТЕТВОТЕ_ТЕМРОКАКУ. 

При успешном завершении функция 5е ЦеАНиЬие$ возвращает ненулевое зна- 
чение в регистре ЕАХ, В случае неудачи функция заносит в регистр ЕАХ значение МИЦ. 

Для получения атрибутов файла используется функция бе!ЕйеАЕтЬиеез: 

ОмОВО безЕ1ТеАЕЕглЬиве$ (ЕРСТЗТВ 1рЕ11еМамте): 

Функция имеет один параметр рЕеМате, который является указателем на 
АЗСП7-строку, содержащую имя файла. 

При успешном завершении функция бе РЙеАН пи ез возвращает значение в ре- 
гистре ЕАХ, которое является комбинацией атрибутов файла, специфицированно- 
го параметром (рЕеМате, Выделить эти атрибуты можно, используя логические 
команды ассемблера или команды обработки битов. В случае неудачи функция 
заносит в регистр ЕАХ значение МИЦ. 

В приложениях очень часто требуется определить размер файла. Для этого 
в \/т32 имеется отдельная функция бе{РЦе$те: 

ОМОКО беЁг11е517е( НАКОЕЕ ИРЗ1е. "РОМОКО 1рЕ11е512еН1ов ); 


Параметры функции означают следующее: 
ВРИе — дескриптор файла, размер которого требуется определить; 
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» рЕйебме Мон — адрес области памяти, куда помещаются старшие 32 бита значе- 
ния размера файла, младшие 32 бита возвращаются функцией в регистре ЕАХ. 


При успешном завершении функция бе Це 1хе возвращает значение младших 
32 битов размера файла в регистре ЕАХ. В случае неудачи функция заносит в ре 
гистр ЕАХ значение ОН. 

Особого разговора заслуживают возможности получения информации о вре- 
менных характеристиках файлов. По сравнению с аналогичными средствами М$ 
005, в МЛ т32 этот вопрос проработан значительно глубже. Хотя если посмотреть 
номенклатуру и описание функций М$ ОО$ для работы с длинными именами 
файлов, то видно, что у них уже есть общие идеи, реализованные рассматриваемы- 
ми ниже функциями \/ 1132. 

Как уже отмечалось выше, в \/т32 с файлом связаны три значения времени: 
время создания, время последнего доступа и время последней модификации. По- 
лучить эти значения можно с помощью функции бе ИеТ те: 


ВООЕ бесЕтТеТ1те( НАМОЕЕ НЕ11е. ГРЕШЕТ1МЕ ТрСгеа тот 1те, ГРЕТЕЕТТМЕ 1рЕа$Ассез$Т1те. 
ГРЕЦЕТМЕ 1рАазиг1ееТ1те): 


Перед вызовом данной функции необходимо открыть файл, о значениях вре- 
менных параметров которого мы хотим получить информацию. Функции бе{ЕИе- 
ТПте передается дескриптор этого файла и указатели на три экземпляра структуры 
ЕИЕЕТМЕ, в которые будут записаны время создания (1рСгеаНопТите), время после- 
днего доступа (1рЁа$Ассез$Пте) и время последней записи (а е[ те). 

Аналогично функции М$ ОО$ 71а7В, \/т32 предоставляет две функции для 
взаимного преобразования ОО5$-времени файла в 64-битовое представление вре- 
мени: 


ВОС. Ел1ет1теТобо$ВафеТ1те(СОМ$Т ЕТЬЕТТМЕ *1рЕ11ет1те. ЕРЫОКО 1рЕафОате. 
1РыОВО 1рЕаеТ1те); 
ВОО ОбозбафеТ1теТоЕ11еТ1те( ОВО иРафОафе. МОНО мРасТ1те. ГРЕЩЕТМЕ ТрЕ11еТ1те):; 


Функция Р(еТитеТобозБайеТте в качестве входного параметра принимает ука- 
затель *\рЕ\еТте на экземпляр структуры Е№ЕТМЕ. Этот указатель содержит пред- 
ставление времени в виде 64-битового значения. На выходе данная функция фор- 
мирует два значения в переменных размером в слово, адреса которых указаны 
параметрами {рРа*бае и \рРате. Формат этих слов совпадает с форматом соот- 
ветствующих параметров, которыми манипулирует функция 71а7Н. 

Функция ОозБаёеТитеТоРЦеТите, наоборот, преобразует время в формате 0О$, 
представленное в виде двух слов — уРаае, мРа те (для времени и даты соответ- 
ственно), в 64-битовое значение (рЕЙе те. 

Установить время создания, последнего доступа или модификации файлов 
можно с помощью функции 5еЕ Ре те: 


ВОО ЗеёЕТТеТ1те( НАМОЕЕ ИЕ71е. соп$Е ЕТЬЕТПМЕ *1рСгеалопТ1те. 
соп$Е РЕИЕИМЕ *1рЬаз+Ассез$Т1те, соп$® ЕШЕТЛМЕ *1рЬа$иглфеТлте); 


В качестве входных параметров функция Зе РИеТите принимает дескриптор 
файла и указатели на три экземпляра структуры НЕЕТМЕ. Экземпляры структур 
уже заполнены необходимыми временными величинами. Если какое-либо из зна- 
чений устанавливать не нужно, то вместо указателя на соответствующую структу- 
ру передается МИЦ. В случае успешного завершения функция возвращает ненуле- 
вое значение в регистре ЕАХ. 
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Из вышеизложенного видно, что для получения различных характеристик фай- 
ла используется множество различных функций. Работа с ними может утомить 
кого угодно. Нельзя ли чего-нибудь попроще? Можно. \/1132 предоставляет фун- 
кцию бе{РепгтаНопВуНапе: 


ВООЕ беёр11еТптогта 1опВуНаиТе( НАМОСЕ пЕТе. 
ЕРВУ_НАМОЕЕ_РТЕЕ_ТМЕОВМАТТОМ 1рЕ11еТпТогта оп) ; 


На вход данной функции передается дескриптор файла, о котором необходимо 
получить информацию, и указатель на экземпляр структуры ВУ_НАМОЕЕ_РТЕЕ_ЛМРЕОВ- 
МАПОМ, который заполняется этой функцией. Как видно из названия полей (см. код 
ниже), в упомянутой структуре сосредоточена вся информация о файле. Ниже 
ПВИВЕН пример кода, использующего данную структуру. 


я Програмна: рг907_32.азт — и1и32-программа консольного приложения для И1п32 | 
| для исследования работы функции СеёЕ11е1пРогта®1опВуНап 1е АРТ \1п32. | 


еее + 
1------ описание структур 
ЕТЕТУМЕ $гис 
Ом омОафеТ1те 94? :; младшие 32 бита значения времени 
@НтТ9Ибатет1те 94? ; старшие 32 бита значения времени 
Е\ЕЕПМЕ епд$ 
В\ НАМОЕЕ ЕТЕЕ ТМЕОВМАТТОМ $Егис 
11 еАееглЬирез$ д4 0 ; атрибуты файла 
$Егис 
ЕЕСгеалопТ1те_РиромбатеТ1те @4? ; младшие 32 бита времени создания файла 
ИСгеаЛопТлте_ОмНТопОатетчте аа ? ; старшие 32 бита времени создания файла 
епб5 
$гис 
ЕЕГазфАссез$Т1те_ОыомОатеТ1те 94 ? ; младшие 32 бита времени последнего доступа 
И НЫ 94? :; старшие 32 бита времени последнего доступа 
еп4$ 
$Егис 
ИЕГазтигиетте_ОиоиОатеТ1те 44 ? : младшие 32 бита времени последней записи 
РЕазтигтвеТ1те_ОмН1опбафеТ1те 44 ? ; старшие 32 бита времени последней записи 
епд$ 
и\МоТитебегза]Митбег а@4 0 :; серийный номер тома. на котором 
:; находится файл 
пЕ11е512еНои аа 0 : старшие 32 бита размера файла 
пЕ1 1651260 940 ; младшие 32 бита размера файла 
пМитоегой лпк$ ча 0 : число ссылок на файл 
пЕПетаехНтон 490 ; старшие 32 бита идентификатора файла 
пР71епдехом @40 ; младшие 32 бита идентификатора файла 
епд$ 
„баба 
то ВУ НАМОБЕ РТЕЕ УМЕОВМАТТОМ <> 
В еТехе (1) ‘Получение информации о файле в И п32`, 0 
ТрВиР [19 "р". 0 
ИЕТе 94 0 
.соде 
НЕ е СгеафеЕ11е 
у------ открываем файл 
ры$И 0 
ри$Н 0 : атрибуты (они игнорируются) 


ризН ОРЕМ_ЕХ1$Т1№Мб6 —; открыть существующий файл. 
: если его нет — ошибка 

ры$Н 0 ; защита файла не требуется 

рип ЕИЕЕ_ЗНАВЕ_КЕАО : разрешено совместное использование 
; файла (по чтению) 

ри$И СЕМЕВТС ВЕАВ ; разрешено чтение из файла 


272 — Гпава7. Работа с файлами в программах на ассемблере 


ризП оЁР5её 1рВиР 

са1] СгеафеЕ11еА 

стр еах. ОРРРЕЕЕЕЕЯ 

3е ех1{ ; если неуспех 

ЮУ НЕТе, еах : дескриптор файла 
14----- бет етРогта&топВуНапа1е 

ри$В оТТ5её 1тТо 


ризп вЕ11е 

са11 бефр11е1иРогтатопВУНап 1е 

стр еах. 0 

Ау ех1е ; выход в случае неудачи 


;------ и смотрим в отладчике 1032.ехе 


Результат або данной программы можно посмотреть и проанализировать 
в отладчике. 


Работа с дисками, каталогами 
и организация поиска файлов 


\М/1п32 располагает большим набором функций для получения информации о струк- 
туре файловой системы конкретного компьютера. Часть этих функций развивает 
идеи работы с файловой подсистемой, появившиеся в последних версиях М$ РО$. 
Другие функции являются уникальными для платформы \/ 1132. Рассмотрим наи- 
более интересные из них. 

Программа, предназначенная для исследования файловой системы, прежде всего 
должна знать, какие логические диски присутствуют в системе. Среди нескольких 
функций, выполняющих эту работу, наиболее удобной для процесса обработки 
является беодтсаОпуе$5 пд: 

О408О бенодтса1Ог1уе5г1па$ (ОМОКО пВиРРегкепаи, ИРТУТВ ТрВи{Рег); 


Данной функции передаются два параметра: [рВиНег — адрес буфера, в который 
помещаются имена корневых каталогов логических дисков, установленных в сис- 
теме; пВиНещепдН — длина буфера, заданного указателем [рВиНег. В качестве воз- 
вращаемого значения функция формирует длину буфера, действительно необхо- 
димую для размещения строки с именами корневых каталогов логических дисков. 
Например, при наличии трех логических дисков структура заполненного буфера 
будет следующей: А:\0В:\0С:\0. Заметьте, что имена корневых каталогов разделе- 
ны нулевыми символами (АМ$1-АЗСИ или Отисоде). Более эффективно вызы- 
вать эту функцию два раза: первый раз с нулевым значением первого параметра, 
при этом функция вернет требуемое количество байтов для размещения буфера; 
второй раз функцию уже можно вызывать, подставив на место первого параметра 
значение, возвращенное при первом вызове. 


:| Программа: ргд07_33.азт. И1п32-консольное приложение для №1п32 для 
: исследования работы функции бе одтса1ОглуеЕглпа$ АРТ №1132. 





пене - + 
„дата 
1 Йетеж (19) ‘Получение информации о дисках в \1п32`. 0 
1йто_риР [6 10 @р (0) 
. сое 


:------ бем.091са1Ог1уе5Ег1пд$ 
ри$й оТРеё 1пРо_ Биг 
ри$Н 0 
са11 беродлса1Ог1ме Е глид5А 
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стр еах. 0 
Ку ех1\ ; выход в случае неудачи 
СЫ вызываем функцию второй раз. когда известно количество байтов 
требуемое для записи списка корневых каталогов 
ризп  оРРзеф То _БиР 


ри$И вах 

са11 бефрод1са1Ог1 уе г1пд5А 

стр еах, 0 

32 ехэ{ ; выход в случае неудачи 


;------ в: смотрим в отладчике ТОЗ2.ехе 


ак т бе{одлсаОпуе$7тд$ состоит в том, что она работает не во 
всех версиях \/ш4о\5. Альтернативным вариантом получения информации о на- 
личии дисков в системе является функция беЧ.одса\пуез. 

Ом0вО сетЕодтса1Оглуез$ (МОТО): 

Эта функция возвращает в регистре ЕАХ битовую маску, в которой установлен- 
ные биты указывают на существование логического диска: бит 0 — А, бит 1 — В, 
бит 2 — С... Таким образом, с помощью функции бейодса!Опуе$ можно достичь 
того же самого результата, что и с помощью функции беНодтсаОпуе5йпд5, но не- 
сколько большими усилиями. 


Программа: рг907_34.азт. ИТп32-консольное приложение для исследования | 
работы функции бе Ёодлса10г1уез$ АРТ № п32. | 


ен н------ + 
„дата 
т\етТехЕ [61°] ‘Получение информации о дисках в \п32'. 0 
таРо_БиР [6 10 @р (0) 
„.соде 
са11 бе .од7са10г1уе$ 
стр еах, 0 
2 ехлф ; выход в случае неудачи 


1------ результат смотрим в отладчике ТОЗ2.ехе 


После того как информация о номенклатуре логических дисков в системе изве- 
стна, можно получить информацию о каждом из них. Для этого используется фун- 
кция бе\оите[погтайоп: 


ВООЕ беф\о1итеТиРогта Топ (ЕРСТУТВ ТрВосЕРаЕИМате. ЕРТЗТВ Тр\о1итеМатеВи Тег. 
ОМОВО п\оТитеМате$12е. ЕРОМОВО Тр\уо1итебегла1Митьег., 
ЁРОИОВО 1рМахлтитСотропетЕепаен. ЕРОМОВО ТрЕ11ебузТетЕТад$, 
ЕРТУТЕ 1рЕ11ебутетМатеВи Тег. ОМОКО пР1ТебузфетМате 1е); 


На вход функции бе\/юоште[т®огтайоп подаются следующие параметры: 


№ 1рКосфРаёИМате — указатель на строку с именем корневого каталога диска, ин- 
формация о котором запрашивается (если параметр равен МИЦ, функция фор- 
мирует информацию о текущем диске). Формат задания имени корневого ка- 
талога диска — имя_диска:\. Это единственный параметр, значение которого 

. Нужно задавать, остальные параметры — адреса областей памяти, в которые 

будут помещены значения, формируемые функцией; 

м |р\оштеМатеВвиЙет и пУоитеМате$1те — указатель на буфер и размер буфера, 
в который будет записано имя диска; 
|рУоштебепаМитБег — адрес двойного слова, куда функция поместит серийный 
номер. Если информация о серийном номере диска не нужна, то при вызове 
функции значение этого параметра необходимо сделать равным МИЦ; 
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{рМахипитСотропеп  епдЁВ — адрес целевого двойного слова, предназначенного 
для значения максимальной длины пути, возможного в данной файловой сис- 
теме; 

” |рЕ\ебужетНад$ — флаги с дополнительной информацией о файловой системе: 

о [5 САЗЕ $ЕМЗТИМЕ = НЕЕ_САЗЕ_$ЕМЗГИМЕ_5ЕАКСН = 00000001Ъ — поддержка со 
стороны файловой системы поиска с сохранением регистра букв; 

О [5 САЗЕ 15_РКЕЗЕКУЕО = ЕТЕЕ_САЗЕ_РКЕЗЕКУЕО_МАМЕФ = 000000026 — при запи- 
си на диск сохранить регистр букв в имени файла; 

о 25 УМСО0Е_$ТОКЕВ_ОМ_015К = ЕЕЕ_ОМТСООЕ_ОМ_01$К = 000000046 — файло- 
вая система поддерживает хранение имен файлов в кодировке Оп!со4е; 

о Р РЕВ$1ЗТЕМТ _АС1$ = ЕЕ _РЕКУЗТЕМТ _АСи$ = 000000086 — файловая система 
способна оперировать со списками контроля доступа (АСГ.) — только для 
МТЕЗ; 

о [5 ЕТЕ СОМРКЕ$$ТОМ = ЕЬЕ_ЕТЕ_СОМРВЕЗЗТОМ = 000000106 — файловая сис- 
тема поддерживает сжатие файлов; 

о Р-Р \. [5 _СОМРКЕЗЗЕЩ = ЕТЫЕ_МОШОМЕ_15_СОМРКЕ$$ЕО = 00008000Ъ — том, о ко- 
тором запрашивается информация, был сжат; 

(р7ебу$етМатеВиЯег и пЕИебуз{етМате$12е — указатель и размер буфера, в ко- 

торый будет помещено имя файловой системы. Если рЕ{ебу$фетМатеВиНег = 

= МИЦ, то в эти параметры ничего не записывается. 


Изменить метку диска может вызов функции 5е\о(ите!ЁаБе|: 
вООЕ ЗеЕ\о1итеЕаБе] (ЕРСТУТВ ТрВоотРаИМате. ЕРТУТВ 1р\о1итеМате); 

Параметр рКосЕРа Мате задает адрес строки с именем корневого каталога диска, 
метку которого меняем. Второй параметр — р\оштеМате — строка с меткой тома. 
Для удаления метки тома с диска параметр р\оштеМате нужно задать равным МИЦ. 


Получить информацию о свободном 

дисковом пространстве 

Информацию о свободном дисковом пространстве, а заодно и о разбиении диска 
на секторы и кластеры позволяет получить функция бе 1$КЕгеебрасе: 


ВОО. бетО1$КЕгеебрасе(ЕРСТУТВ ТрКоо{РаИМате. ЕРОМОВО 1р$естог$РегСТиз Тег. 
ЕРОМОВО ТрВусезРегбесеог. 1РОМОВО 1рМитьегОТЕгееСТизфег$. 
ЕРОИОВО ТрТофа]МитьегО СТ изтег$); 


На вход функции нужно подать строку с именем корневого каталога интересу- 
ющего диска (МИЦ. для текущего диска) и адреса буферов, куда будет помещена 
следующая информация: общее количество кластеров на диске (\рТоа{МитБег- 
ОРСш$Еег<), общее количество свободных кластеров (р№МитБегОЕРгееСше{ег<), коли- 
чество байтов в секторе (фВуезРегбесйог), количество секторов в кластере (р5$есюгс- 
РегСиз%ег). 


Создание и удаление каталога 


Создание каталога выполняет функция СгеаеОесогу: 
ВООЁЕ Сгеафе0лгесфогу(ЕРСТУТВ ТрРаЕИМате. ЕРЗЕСИВТТУ АТТАТВИТЕ$ 1рбесиглфуАЕЕглЬитез): 
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Первый параметр этой функции фРа{Мате — указатель на АЗСПЯ-строку с 
путем, последний элемент которого является именем нового каталога. Параметр 
[р5есиМуАНиБие$ — указатель на экземпляр структуры бесиу_АНпБиеез. 
ЗЕСИВТТУ_АТТАТВУТЕ$ $%гис 


пЕепауи ва 0 
Тр5есиг1убезсглреог 99 0 
Ыппег {Нап 1е 99 0 


ЗЕСИУВТТУ АТТЕТВОТЕ$ еп4$ 

С помощью структуры $есиу_АЧИБиез можно ограничить доступ пользова- 
теля к каталогу. Параметр (р5есиуАНиЬще$ обычно задается равным МОИ. Более 
подробная информация о параметрах структуры имеется в документации М$ОМ. 

За удаление каталога отвечает функция Кетоуе/гесогу: 
ВОО. Кетоме0лгестогу(1:РСТУТВ ТрРафИМате) ; 

Единственный параметр этой функции (рРа Мате — указатель на АЗСП7-стро- 
ку с путем, последний элемент которого является именем удаляемого каталога. 
Удаляемый каталог не должен быть пустым. 


Определение и изменение текущего каталога 


Аналогично принципам организации файловой системы М$ ОО$, в \!/ 1132 также 
существует понятие текущего каталога, то есть каталога, в котором выполняются 
текущие операции по работе с файлами. В отличие от М$ РО$5, понятие текущего 
каталога относится к текущему процессу. При запуске процесса текущим будет 
являться каталог, из которого этот процесс был запущен. Определяет текущий ка- 
талог процесса функция бе Ситет Отесогу: 

ОмОкО беЕСиггетЕОзгесеогу(ОиОвО пВиРРегепдаёй. ЕРТЗТВ 1рВиТРег); 

Параметры рВиЙет и Вибе ета устанавливают соответственно адрес и дли- 
ну буфера, в который помещается путь с текущим каталогом (строка с завершаю- 
щим нулем). Функция возвращает МИЦ: в случае ошибки и число байтов, необхо- 
димое для записи данных в буфер, в случае удачного срабатывания. Завершающий 
нуль в возвращаемом функцией числе не учитывается. Если буфер мал, то с помо- 
щью возвращаемого значения можно изменить его размер. 

Изменить текущий каталог процесса можно посредством функции 5еёСитепт- 
Озгесеогу: 

ВОО. ЗееСиггепе0лгесвогу(ЕРСТУТЕ 1р$2Ра{ИМате); 

Параметр [р$2РаНМате — адрес АЗСП7-строки с путем, последний элемент ко- 
торого — новый текущий каталог данного процесса. 

Платформа \/т32 также поддерживает понятие системного и основного ката- 
лога У/т4о\/. Для определения системного каталога существует специальная 
функция бебу$етОтесвогу: 

ИМТ бегбузфетО1гесфогу(ЕРТЗТВ Тр$2ВиРег. ШММТ иб12е): 

Два параметра этой функции — это адрес и размер буфера, в который записы- 
вается путь к системному каталогу УЛп4до\/. Возвращаемое значение — количе- 
ство реально записанных в буфер байтов. Его можно использовать для корректи- 
ровки параметра ие, если тот был задан слишком маленьким, и повторного вызова 
функции бебуетОескогу. Проверить, является ли каталог системным, можно, 
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попытавшись создать в нем файл. Если файл системный, ваша попытка будет не- 
удачной. 

Для определения основного каталога \п4о\/; существует специальная функ- 
ция бей\пдоми$ ОттесКогу: 

ЦМТ бей паом$ 01 гесфогу (ЕРТУТВ ТрВиРРег. ИМТ и512е): 

Два параметра этой функции определяют адрес и размер буфера, в который 
записывается путь к основному каталогу \Лш4о\з. Возвращаемое значение — ко- 
личество реально записанных в буфер байтов. Оно применяется для корректиров- 
ки параметра и1те, если последний был задан слишком маленьким, и повторного 
вызова функции бе пдаом/$ОутесЕогу. 

Для демонстрации применения представленных выше функций рассмотрим 
комплексный пример, в ходе которого продемонстрируем порядок вызова и ана- 
лиза возвращаемых значений функциями АР] МЛп32 для работы с каталогами. То 
есть: определим текущий каталог процесса, создадим новый каталог, сделаем его 
Ри удалим новый каталог, определим системный каталог и каталог Уп о\5. 


Программа: рг907_35.а5т. ИАп32-консольное приложение для исследования 
функций для работы с каталогами АРТ И1п32. 


ан ---- + 
дата 
Т1йетехё [619] "Работа с каталогами в И1п32". 0 
№ 07 г [4 "Новый каталог”, 0 
ОГ Би Ч 50 дир (“?") 
$12е_Ч1г_ Вит = $ - @г вт 
Рагепф [619] ИО 
.соае 


ны определим текущий каталог 
ризп  ОРРхер 1г Бит 
рип — 5127е @1г_БиР 
са11 беСиггепте 01 гестогуА 


стр еах. 0 

Ку ехлЕ : выход в случае неудачи 
------ создадим каталог 

ризИ 


0 
ризй оЁРзеё МемО1г 

са11 Сгеатеб1гестогуА 

стр еах. 0 

Кул ех1{ ; выход в случае неудачи 
;------ сделаем новый каталог текущим 

ризИ оРРхег МемО7г 

са11 ЗеЕСиггепО1гестогуА 

стр еах. 0 

Ку ех1{ : выход в случае неудачи 
------ проверим новый текущий каталог 

рип ОРРбеф 91г Бит 

рип $12е_@1г БИТ 

са1] беСиггепЕ01гестогуА 


стр еах. 0 
Ау ех1 ; выход в случае неудачи 
------ 5етСиггепЕ 1 гесфогу 


------ вернемся в родительский каталог 

ризй оТ(сеё Рагепё 

са11 5еЕСиггепЕ01гескогуА 

стр еах, 0 

му. ех1е ; выход в случае неудачи 
------ проверим новый текущий каталог 

ризи — оРРеё @1г БР 
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ризп — $12е_О1г Бит 

са11 бееСиггепЕ 01 гестогуА 

стр еах. 0 

ира ех1{ ; выход в случае неудачи 
----- удалим новый текущий каталог 

ризИ ОТЕсеё МемО1г 

са11 Кетомеб1 гесфогуА 


стр еах. 0 

32 ех1Е ; выход в случае неудачи 
;------ определим системный каталог 

[ет еах. $12е_@1г Бит 

ризй еах 


ризп — ОГ@зеё ФГ БР 
са11 бетбузфетО1 гесфогуА 


стр еах, 0 

Ау ех1Е ; выход в случае неудачи 
:------ определим основной каталог Ч пдом$ 

ЮУ еах. $12е_1г Бут 

ризИ еах 


ризи  оТзеф д1г Би 

са11 бее\Чпаом$ 01 гесфогуА 

стр еах. 0 

2 ех1{ : выход в случае неудачи 
1------ результат смотрим в отладчике ТОЗ2.ехе 


Среди функций \/1т32, работающих с текущим каталогом, присутствует функ- 
ция бе{Ри{Ра Мате, которая по имени файла формирует его полное имя, состоя- 
щее из пути от корневого каталога к текущему. Последний элемент этого имени — 
имя входного файла. 


БиОЕО бефри?1РаЕиМате(ЕРСТЗТК 1рЕ11еМате. ОМОКО пВиРег-епдаей. ЕРТУТК ТрВиРег. 
ЕРТУТВ *1рЕ11еРаг{); 


На входе функция принимает имя файла в виде АЗСПИ7-строки. Три других 
параметра: 

\рВиЁег — адрес буфера, в который помещается полный путь с именем файла; 

пВиНефепдЁЙ — длина буфера, на который указывает параметр (рВийЙег, в символах; 


рЕЙеРап: — адрес ячейки размером с двойное слово, в которую помещается ука- 
затель на позицию внутри буфера, идентифицированную параметром рВиЙеги 
соответствующую первому символу имени файла после имен всех каталогов. 


Самое интересное в этой функции — механизм ее работы. Суть его в том, что 
реально функция бе Ри(Ра Мате не ищет файл, на имя которого ссылается пара- 
метр 'рВиЙег. Результат своей деятельности — полный путь — она формирует из 
двух компонентов: полного пути к текущему каталогу данного процесса и имени 
файла, наличие которого на диске функция бе{РиЙРаИМате даже не смотрит. Для 
подобной работы ей вовсе не нужно обращаться к диску. С ее аналогом мы уже 
сталкивались, когда рассматривали функции М$ ОО$ для работы с файлами, име- 
ющими длинные имена. 


Поиск файлов 

При последовательном изучении материала данного раздела читатель, кроме зна- 
комства со средствами по работе с файлами операционных систем фирмы М1сгозой, 
поневоле должен был оценить процесс эволюции этих средств. Особенно очеви- 
ден этот прогресс в отношении к поиску файлов. 
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Платформа \!1132 предлагает два способа поиска файлов: 
при помощи функции $еагсНРаЕЙ; 
посредством функций Ипа Рг<ЕРЦе, РиаМЕхЕРЦе и структуры ММ32_ЕТМО_ОАТА. 


Поиск файлов с помощью функции ЗеагсНРа! 


Функция $еагсНРаЙ ищет файлы в указанном при ее вызове списке каталогов. 


ОМОКО ЗеагспРати(ЕРСТУТВ ТрРафи. ЕРСТУТВ 1рЕ11еМате. ЕРСТУТВ ТрЕхеепз1оп, 
ОМОКО пВиРегьепдаен. ЕРТЪТВ 1рВи Рег. ЕРТУТВ *1рЕ1ТеРаг®); 


Первый параметр [рРаЁВ определяет список каталогов, в которых будет осуще- 
ствляться поиск файла. Параметры (рЕ{еМате и рЕЖеп$юоп указывают на АЗСП7- 
строки с именем и расширением искомого файла. Наличие пары этих параметров 
позволяет задавать имя и расширение файла двумя способами: 


одной АЗСП/-строкой — на нее указывает параметр (рЕЦеМате, при этом пара- 
метр 1рЕжеп$Топ равен МИЦ; 

отдельными АЗСП7-строками — в этом случае параметр рЕеМате содержит 
указатель на АЗСИ-строку с именем файла, а второй параметр — (рЕжеп$юп — 
содержит указатель на АЗСПЙ-строку с расширением файла; строка с расши- 
рением должна начинаться с символа . (точка). 


Параметр (рВиЙег указывает на буфер, куда записывается АЗСП7-строка с пу- 
тем кискомому файлу. Длина буфера определяется параметром пВиНейепден. Если 
эта длина слишком мала, то ее можно подкорректировать значением, возвращае- 
мым функцией в регистре ЕАХ. Данное значение является количеством символов, 
действительно необходимых для записи полного имени найденного файла в бу- 
фер. Если в ЕАХ возвращается МИЦ, то это говорит об ошибке вызова функции. 

Последний параметр рЕЦеРай. является указателем на символ в буфере, с кото- 
рого начинается собственно имя файла. 

При вызове функции 5еагсНРаВ параметр (рРаЁА можно задать равным МИ. 
В этом случае поиск файла будет осуществляться в следующих каталогах (поря- 
док перечисления соответствует очередности просмотра при поиске): 


каталог, из которого запущено приложение; 
текущий каталог; 

системный каталог; . 

основной каталог МЛ п4о\$; 

каталоги, перечисленные в переменной окружения РАТН. 


Поиск файлов с помощью функций Етариз Ее и ЕтаМежЕЦе 


Предыдущий способ поиска обладает существенным недостатком — ограниченным 
числом каталогов диска, подвергающихся просмотру в процессе поиска. По этой 
причинеон не применим для поиска в пределах всего диска. Означенный недоста- 
ток устраняется при втором способе поиска — с использованием функций Рпб- 
РзЕРЦе, Ра ЧМЕХЕЕЦе и структуры М №32_Е1ТМО_ОАТА. Этот способ реализует опреде- 
ленный алгоритм поиска. Вначале вызывается функция НпаАг$ЕЕИе, которая имеет 
два параметра: {рЕеМате — указатель на АЗСП-строку с именем файла; [рАпаР{еака — 
указатель на экземпляр структуры М№32_ЕМО_ВАТА. 

НАМОЕЕ РЕ1пдР1г$Е1е(ЕРСТУТВ ТрЕ11еМате. ЕРИТ\З2_Е1№0 АТА ТрЕ1паг1Тебаха) ; 
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Имя файла может содержать символы шаблона * и ?. Кроме того, имя может 
содержать путь, с которого нужно начинать поиск. Выше, при знакомстве с функ- 
циями М5 ОО5 для работы файлами, имеющими длинные имена, приводилось 
описание структуры \М1М32_ЕТМО_ВАТА и ее полей. 

В случае успеха функция АпаРг$ЕРИе заполняет поля структуры М МЗ2_ЕТМО_ОАТА 
и возвращает значение дескриптора внутренней структуры в памяти, который впо- 
следствии может быть использован функцией Ап@МехЕРЦе или Нп@(Цозе. В случае 
неудачи функция не изменяет содержимое структуры \1М32_ЕМО_АТА и возвра- 
щает значение 1ММАНО_НАМОЕЕ_МАГОЕ (ЕАХ = —110 (десятичное) = ОН). 

Проанализировав результаты поиска, программа может продолжить или пре- 
кратить его. Для продолжения поиска необходимо вызвать функцию Нид МЕхЕРЦе: 
ВООЕ Е1иОМехег11е( НАМОЕЕ ПЕлпдЕ11е ЕРИТМЗг_ Е1МО_ОАТА ТрЕ1паЕ11ебака ): 

В качестве параметров используются дескриптор, полученный в регистре 
ЕАХ в результате поиска функцией НпаРг$ЕЕЦе, и указатель на экземпляр струк- 
туры \М32_ЕМО_ОАТА. В случае успеха функция Ри@МехЕ Це возвращает нену- 
левое значение в регистре ЕАХ и заполняет структуру \М32_ЕМО_БАТА. При 
неудаче — ЕАХ = 0. 

Для продолжения поиска при неизменных исходных параметрах поиска функ- 
ция Рид М№ехЕРИе вызывается циклически. 

Для окончания процесса поиска необходимо вызвать функцию Ап (ое: 

ВОО. Е1идС10$е( НАМОЕЕ ИЕ1пагл1е ); 

Функция Рпа(озе имеет один параметр — дескриптор, полученный функцией 
АпаРизЕРЦе в начале поиска. В случае успеха функция Ипа оче возвращает нену- 
левое значение в регистре ЕАХ, при неудаче — ЕАХ = 0. 


Файлы, отображаемые в память 


Платформа \/1т32 позволяет организовать работу с содержимым файла как с об- 
ластью оперативной памяти, без обращения к операциям файлового ввода-вывода. 
Этот механизм отображает (проецирует) содержимое файла на область оператив- 
ной памяти. Программе передается адрес этой области, после чего работа с содер- 
жимым файла осуществляется командами работы с памятью. 

Для «проецирования» файла необходимо выполнить следующие действия. 


1. Требуется создать (для несуществующего файла) или открыть (для существу- 
ющего файла) объект ядра файл. Цель этого шага — сообщить системе, где на- 
ходится физическое представление файла. Создание или открытие объекта ядра 
файл выполняется с помощью функции Сгеа{еРИе (см. выше). Все параметры 
этой функции задаются обычным образом. На выходе в случае успеха функция 
формирует дескриптор (в регистре ЕАХ), в обратном случае — значение 1ММАМО_ 
НАМОЕЕ_МАГОЕ (ЕАХ = —1 (десятичное) = ОН). 


2. Требуется создать объект ядра проекция файла. Цель этого шага — сообщить 
системе размер проецируемого файла. Для этого предназначена функция Сгеа{е- 
РИеМарртд: 

НАКМОЕЕ Ссеатег11емарраид(НАМОЕЕ НЕ11е. ЕРЗЕСИВТТУ АТТЕТВИТЕ$ ТрЕ11еМарруидА гц ез. 


ОиовО ЕТргохесе. ОМОВО @мМахтитб12ентан. Биово @мМах1титб12еЕ ом, 
ЕРСТУТВ 1р№ате); 
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Параметр НЕе является дескриптором файла, полученным функцией СгеавеРе. 
Параметр {рЕ\еМарртдАНиЬи(е$ — указатель на экземпляр структуры 
$ЕСОКГТУ_АТТЕТВИТЕЗ, которая служит для установки защиты. Присвойте пара- 
метру рЕ{еМарртдАНИЬце$ значение МИ. Параметр АРго!ес( предназначен для 
установки атрибутов защиты страниц физической памяти в адресном простран- 
стве процесса, на которые отображается файл. Используют один из следующих 
атрибутов: 
О РАбЕ_КЕАБОМУ = 02 — доступ к файлу разрешен только по чтению (при ис- 
пользовании этого параметра вызов Сгеаёе (е должен производиться с фла- 
гом СЕМЕКТС_ВЕАО); 


О РАСбЕ КЕАБМЕЮТЕ = 04 — доступ к файлу только по записи (вызов СгеаеРе 
должен производиться с флагом бЕМЕКТС_КЕАО | СЕМЕЕТС_\М/КТЕ); 


О РАбЕ_МЕТЕСОРУ = 08 — доступ к файлу в режиме чтения-записи с созданием 
копии данных из файла; при этом исходный файл не изменяется, изменения 
касаются лишь модифицированных страниц копии в страничном файле (вы- 
зов Сгеа{еР{е должен производиться с флагом бСЕМЕКС_КЕАВ или СЕМЕЕТС_КЕАО 
| СЕМЕВТС_М/ЕТЕ). 


Параметры 9мМахйтит$12еН1аН и 9иМахитит$12еЁ ом предназначены для того, 
чтобы сообщить системе максимальный размер файла в байтах. При этом 
в ЧмМах!тит512е[о\ указываются младшие 32 бита этого значения, а в 
Ч\МахтитбеН1аН — старшие 32 бита. Если предполагается размер файла, рав- 
ный текущей его длине, то следует при вызове функции передать 9мМах1- 
тит его = 4\/Махитит$12еНТан = МИЦ. 


Последний параметр (рМате — указатель на АЗСП7-строку с именем объекта 
«проецируемый файл» для обеспечения доступа к нему других процессов. Обыч- 
но задают равным МИМ. 


3. Требуется выполнить проецирование файла на адресное пространство процес- 
са. Здесь преследуются две цели. Первая — сообщить системе порядок отобра- 
жения (проецирования) файла на адресное пространство процесса — полный 
или частичный. Вторая цель — получить адрес этого проецирования в памяти. 
Реализация означенных целей достигается функцией МарМемОЕЕЦе: 


ЕРУОТЬ Мар\УтемОТЕ11е(НАКОЦЕ ПЕ11еМарртпо0Ьдесе. ОМОВО ди0ез1гедАссез$. 
О\ОВО амЕ11ебЕхеЕНтон. ОмОКО @мг11е05еН.ои, ОиовО диМитьегО{Вуте$ТомМар): 


Параметр ВРЦеМарртд0есЕ — дескриптор, возвращенный функцией СгеаеЕИе- 

Марртд на предыдущем шаге. Параметр 9мОезтедАссез$ определяет вид досту- 

па к данным: 

о РЕЕ_МАР_СОРУ = 1 — данные в файле доступны по чтению, хотя отображен- 
ные данные доступны по чтению и по записи; операция записи приводит 
к созданию копии страницы в страничном файле, в которую производится 
запись, поэтому после первой операции записи теряется соответствие меж- 
ду реальными данными на диске и данными, с которыми работает приложе- 
ние (при использовании этого значения параметра 9м!Ое$тедАссез$ функция 
С(геафеРЦеМарр тд должна быть вызвана с одним изатрибутов: РАбЕ_ КЕАБОМУ, 
РАбЕ_КЕАОМ/ЕТТЕ или РАбЕ_\М/КТЕСОРУ); 
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о РЕЕ_МАР_МКГТЕ = 2 — данные в файле доступны по чтению-записи (тогда 
функция СгеаеРИеМарртд должна быть вызвана с атрибутом РАСЕ_ 
КЕАБМКТЕ); 


о ЕЕ _МАР_ВЕАО = 4 — данные в файле доступны по чтению (функция Сгеаве- 
РИеМарртд должна быть вызвана с одним из атрибутов: РАбЕ_КЕАБОМУ, 
РАбЕ_КЕАБМЕПЕ или РАбЕ_М/ЕТТЕСОРУ); 


о А\Е МАР_АЦ._АССЕЗ$ = 000-0000 | 000000011 | 000000028 | 000000048 | 000000081 | 
000000108 — данные в файле доступны по чтению-записи (соответственно 
функция СгеаеРЦеМарртд должна быть вызвана с атрибутом РАбЕ_ 
КЕАРМЕТТЕ). 


Параметры амЕе0Ней рН, дмЕЛеоЯеН.о\ и 9МитьБегО7Ву{е$ТоМар предназна- 
чены для указания позиции в файле, с которой начинать отображение, и коли- 
чества отображаемых байтов (Ч\иМитБегО!Вуе$ТоМар). Параметр ЧмЕИе- 
ОН5еНав — старшие 32 бита этого смещения, а параметр дмЕЦе0Нзеом — 
младише 32 бита этого смещения. Таким образом, с файлом допустимо рабо- 
тать не целиком, а по частям, эффективно расходуя при этом операгивную па- 
мять. Заметим, что если задать параметр Ч МитЬегОВу{еТоМар равным МИЦ, то 
система будет пытаться отобразить содержимое файла с места, указанного па- 
рой дмЕИе0ЯееН1аН: ам ЦеоЕбеом, и до конца файла. 


В случае успеха функция формирует адрес проекции в памяти (регистр ЕАХ), 
в противном случае ЕАХ = 0. После получения в ЕАХ адреса начала отображения 
в памяти, приложение может работать с данными файла обычными командами 
работы с памятью. При необходимости функция Мар\МемО#ЕЦе может быть вы- 
звана повторно с другими параметрами — 9м)езиедАссе$$, дмЕЦеоеенНааи, 
диЕИе0Я5еН.ом и 4мМитьегОЕВуе$ТоМар. При этом (запомните!) резервируется 
новый регион в памяти. 


После выполнения необходимых действий приложение должно корректно за- 
вершить работу с отображением файла. 


. Требуется выполнить разрыв связи данных в файле и соответствующими дан- 
ными, отображенными на адресное пространство процесса. За это действие от- 
вечает функция /птар\МемРЕие: 

ВО0Е ИптарУТемОТЕ11е( ЕРСМОТО 1рВазеАдагез$); 

Эта функция имеет единственный параметр — фВазеАЧагез$, который является 
значением, возврашенным функцией Мар\Мем Ее. С помощью функции 
Уптар\МемО!ЕЦе необходимо разрывать каждое из отображений, созданных по- 
следовательностью вызовов Мар\МемОЕЕИе, сохраняя при этом их соответствия. 
Также имейте в виду, что если функция Мар\ЧемОЕЕЦе была вызвана с парамет- 
ром НЁЕ_МАР_СОРУ, то после вызова Уптар\ЛемО!РИе теряются все внесенные 
в отображенные данные изменения. 


. Далее нужно закрыть объект ядра «проекция файла». В принципе, этот и сле- 
дующий шаг не являются обязательными, так как система в процессе заверше- 
ния работы приложения самостоятельно открепит все ресурсы. Освобождение 
объекта ядра «проекция файла» производится функцией С1о5еНапе. 
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8001. СТозеНапа1е( НАМОЕЕ ВОБзес®): 
Функции С!юзеНап@е передается единственный параметр НОесЕ — дескриптор, 
сформированный как результат вызова функции Сгеа{еР(еМарр1пд. 


6. Требуется закрыть объект ядра «файл». Освобождение объекта ядра «файл» 
также производится функцией (105еНапе: 


ВОО СТозеНапе( НАМОЕЕ ПОБзесе ):; 

Функции С1озеНапе передается единственный параметр НОЦесЕ — дескриптор, 

полученный как результат вызова функции СгеаеЕе. 

Пример программы (рг907_36.азт), демонстрирующей порядок использования 
файлов, отображаемых в адресное пространство процесса, достаточно велик и по 
этой причине вынесен отдельно, его можно найти среди материалов, прилагаемых 
ккниге. Работа программы проста и заключается в следующем: поставлена задача 
вывести содержимое некоторого файла на экран — в окно консоли. Имя исходного 
файла вводится с клавиатуры. 





Глава 8 


Оптимизация программного 
кода. Профайлер 


Конструктор знает, что он достиг совершенства не 
тогда, когда нечего больше лобавить, а тогла, когда не- 
чего больше убрать. 


Антуан де Сент-Экзюпери 


Часто задают вопрос о времени выполнения той или иной команды. Возникнове- 
нию этого вопроса есть две причины. Первая — практическая. Всем хочется, чтобы 
его программа работала быстро и была не очень требовательна к ресурсам. Учиты- 
вая то, что современные компьютеры имеют объемы памяти и процессоры с быстро- 
действием, достаточным для сглаживания недостатков в подготовке программиста 
в плане написания оптимальных программ, существует вторая причина — «спортив- 
ный интерес». Здесь ситуация как в спорте — получить максимальный результат 
и моральное удовлетворение. Популярные сегодня различные соревнования но про- 
граммированию подтверждают это. На них часто встречаются задачи, требующие 
понимания задачи оптимизации вообще и наличия определенных навыков опти- 
мизации в частности. В любом случае, задуматься о том, насколько оптимален со- 
здаваемый код — признак мастерства программиста. В большинстве случаев поня- 
тия «оптимизация» и «скорость работы» — синонимы. 

Задача оптимизации исходного кода на любом языке программирования мно- 
тогранна и предполагает многоуровневую схему своей реализации. Во-первых, 
оптимальным должен быть алгоритм верхнего уровня, то есть основной алгоритм, 
реализующий постановку задачи. Во-вторых, дополнительной оптимизации мо- 
гут быть подвергнуты отдельные участки алгоритма верхнего уровня. Как правило, 
для большой программы всегда можно выбрать несколько варнантов реализации 
ее отдельных фрагментов. И, в-третьих, оптимальный алгоритм должен учитывать 
особенности аппаратуры, на которой будет выполняться реализованная наего осно- 
ве программа. Как правило, реализация этого уровня в ирограмме производится 
с использованием ассемблерных вставок или внешних процедур, написанных на 
ассемблере. Исходя из этого, в данной главе мы и рассмотрим вопросы, связанные 
с этим уровнем, хотя некоторые моменты могут быть приложены и ко второму 
уровню. 
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Из материала учебника [39] следует, что код, написанный на любом языке про- 
граммирования, в конечном итоге оказывается переведенным компилятором на 
машинный язык и исполнен вполне конкретным процессором. Современные ком- 
пиляторы достаточно «умны» и «знакомы» с особенностями многих современных 
процессоров. Большинство типовых алгоритмических конструкций программы они 
переводят на машинный язык наиболее оптимальным способом и зачастую далеко 
не так, как это себе представляет программист. Поэтому, с одной стороны, анали- 
зируя, а тем более реассемблируя код, программист должен понимать разницу меж- 
ду исходным и внутренним представлением программы. С другой стороны, не- 
обходимо осознавать то, что, оптимизируя код, компилятор работает на основе 
некоторых шаблонов и типовых схем и не способен предусмотреть все возможные 
случаи. Поэтому программист должен всегда иметь возможность внести свой вклад 
в оптимизацию программы, исходя из особенностей конкретного алгоритма. 

Целью этой главы не является составление законченного рецепта, с помощью 
которого все вапги программы вдруг станут оптимальными. У нее другая задача — 
сформировать правильное понимание проблемы оптимизации низкого уровня, | 
показать источники, где искать эти рецепты, и, в конечном итоге, побудить читате- | 
ля к тому, чтобы задуматься об этой проблеме и осмысленно подходить к выбору 
средств для ее решения. 

В самом общем виде план низкоуровневой оптимизации программы можно 
представить в виде следующих этапов: 


1. Уточнение типов процессоров, на которых планируется исполнение программы. 


2. Выяснение и выделение критичных, с точки зрения быстродействия, участков 
программы. 
3. Выбор приемов оптимизации. 


4. Оценка качества оптимизации. 


Выбор методов оптимизации и ее результаты прямо зависят от типа процессо- 
ра, на котором предполагается функционирование программы. Программа, пред- 
назначенная для работы на разных процессорах, должна первым делом определять 
текущий процессор. Нет проблемы написания оптимальной программы на языке 
ассемблера вообще, есть проблема написания программы, оптимально исполняе- 
мой на конкретном типе процессора. Чтобы оптимизировать программу, програм- 
мист должен представлять себе особенности функционирования процессора, для 
которого она пишется. По этой причине при обсуждении архитектурных элемен- 
тов семейств процессоров Репйит будем указывать, о каком конкретно нроцессо- 
ре или семействе процессоров идет речь — семейство Рб (Репиит НИШ — РП/ 
ПГ и №: Вигзё (Репйит 4). При необходимости программа должна иметь несколь- 
ко ветвей, содержащих разные реализации одного и того же участка кода, отличия 
которых заключаются в использовании приемов оптимизации, ориентированных 
на конкретный тип процессора или семейство процессоров. 


Определение типа процессора 


Начиная с систем команд последних процессоров 180486 и первых РепНит, сведе- 
ния о типе и особенностях текущего процессора можно получить с помощью ко- 
манды СРУШО. Подробную информацию об этой команде вы найдете в приложе- 
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нии А учебника [39], пример использования приведен там же в главе 18. Если вы 

хотите написать универсальную программу, пригодную для работы на всех типах 

Нбе]-совместимых процессоров, то команду СРИТО лучше использовать в соответ- 

ствии со следующими правилами: 

1. Выяснить, поддерживает ли используемый транслятор ассемблера команду 
СРИТО. Этот факт выявится после первого запуска вашей программы на транс- 
ляцию. В листинге строка с командой СРИТО будет помечена как ошибочная. Из 
данной ситуации два выхода: первый — обновить версию пакета ассемблера; 
второй — моделировать команду СРИТ последовательностью байтов БОТ", ба2В. 


2. Выяснить, поддерживает ли текущий процессор команду СРИТО. Для этого нуж- 
но проанализировать бит 21 регистра ЕРТАС5. Он введен в архитектуру процес- 
сора специально с целью поддержки программной идентификации текущим 
процессором команды СРИУТ: 


ри$ На ; регистр ЕР-Аб5 
рор еах : ЕРЬАб$ > ЕАХ 
ОУ ебх. еах : сохранили для дальнейшего сравнения 
хог еах. 2000000 : изменили 21-й бит ЕАХ 
у------ восстанавливаем ЕР-Аб5 и проверяем факт изменения 21-го бита 
ри$И еах 
рор?та 
риз На 
рор еах 
хог еах. ебх 
$е5ф  еах. 2000000 : проверяем 21 бит 
ира пое_зирроге : СРУШО не поддерживается 


3. Выяснить количество функций, поддерживаемых командой СРИУТО текущего 
процессора. Команда СРУТО не является закостенелым образованием. Она раз- 
вивается вместе с развитием семейств процессоров ше] и изначально спроек- 
тирована так, чтобы разработчик программы мог динамически узнавать воз- 
можности процессора и при необходимости корректировать ход выполнения 
программы. В Репиизт 4 доступно четыре функции, их номера (от 0 до 3) пред- 
варительно помещаются в регистр ЕАХ. В ответ процессор возвращает опреде- 
ленную информацию о текущем процессоре [39]. 


Приемы оптимизации 


В этом разделе мы рассмотрим элементы программы на ассемблере, на которые 
следует обращать внимание при проведении оптимизации, сами приемы оптими- 
зации, а также разъяснение причин архитектурного уровня процессора, благодаря 
которым тот или иной прием оптимизации работает. Интересно то, что после ста- 
нет видна неоптимальность большинства представленных в учебнике и дан- 
ном практикуме программ. Не нужно спешить с критикой, главное помнить 
правило — то, что оптимально для одного процессора, совсем не обязательно 
будет оптимальным для другого процессора. Целями и задачами учебника и 
практикума является обучение использованию всего множества команд Гпёе|- 
совместимых процессоров для программирования типовых алгоритмов. На 
этапе изучения языка ассемблера задачу оптимизации логично вынести на 
последний этап этого процесса. 
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Перечислим элементы программы на ассемблере, на которые необходимо обра- 
щать внимание при оптимизации программы. В первую очередь это: 


описание данных и операций доступа к памяти; 
циклические конструкции и переходы; 


оптимизация, где возможно, последовательности команд. Замена одних команд 
другими, эквивалентными по принципу работы, но более оптимальными для 
текущего процессора; 

= планирование исполнения команд с учетом особенностей текущего процессора. 


Архитектурные особенности 
процессоров РепНит 


Ниже приведено более подробное обсуждение приемов оптимизации вышгепере- 
численных программных элементов. Целевыми процессорами обсуждения выбра- 
ны процессоры Репиит. Вначале рассмотрим подсистемы процессоров Релйит, 
особенности работы которых имеют значение для эффективного решения пробле- 
мы автоматизации. Это кэш-память и конвейер. 


Кэш 


Идея кэширования данных получила свое воплощение в процессорах [ш%е|, начи- 
ная с 180486, и оказалась эффективным средством повышения их производитель- 
ности. С тех пор архитектура подсистемы кэширования вызревала параллельно с 
развитием архитектуры процессора и все более в нее интегрировалась. Понимание 
особенностей работы кэш-памяти играет важную роль в планировании и проведе- 
нии оптимизации программы. 

Основная цель наличия кэш-памяти — хранить последние, недавно использо- 
вавшиеся данные и команды «поближе» к процессору. Расчет простой — с опре- 
деленной вероятностью можно предположить, что обращение к этим данным 
и командам будет скоро произведено снова. Современные процессоры обычно 
поддерживают до трех уровней кэш-памяти, они обозначаются [.1, [.2, 1.3 соответ- 
ственно. Кэш-память первого уровня, по преимуществу, очень маленькая и нахо- 
дится наодном кристалле с процессором. Как правило, она является разделенной — 
по 8 или 16 Кбайт для кода и для данных. Так, в процессорах семейства Рб кэш- 
памяти команд и данных первого уровня (1.1) имеют размеры по 8 или 16 Кбайт. 
Кэш-память второго уровня (Т.2)) является смешанной, имеет много больший раз- 
мер (до 1 Мбайт), чем кэш-память первого уровня, и содержит все ее данные и ко- 
манды. Эта память уже не находится наодном кристалле с процессором, но конст- 
руктивно объединена с ним посредством высокоскоростной шины. 

Существуют несколько архитектур кэш-памяти. В основе их работы лежат сле- 
дующие принципы. Вся оперативная память делится на блоки фиксированного 
размера, называемые строками кэш-памяти. Длина строки до 64 байтов. Все обра- 
щения процессора к памяти, за исключением некоторых случаев (см. ниже), про- 
изводятся через кэш-память. Первым его действием является попытка обнаружить 
ячейку памяти или команду в кэш-памяти первого уровня. Основой для этого яв- 
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ляется целевой адрес в оперативной памяти. Если попытка была неудачной (кэш- 
промах), то производится генерация запроса на системную игину для доступа 
к нужной ячейке памяти и одновременно делается попытка обнаружить нужные 
данные или команду в кэше более высокого уровня (1.2), если он есть. Таким обра- 
зом, кэш-память всегда чем-то заполнена. 


Страница памяти 


Кэш- Кэш- 
каталог память 












Номер Данные 
страницы из памяти 


Биты 
управления 







Номер Номер строки Слово Байт 
страницы в странице в строке в слове 


31 16 15 54 3 21 0 
Рис. 8.1. Архитектура кэш-памяти прямого отображения 





Принцип работы кэш-памяти поясним на примере ее самой простой организа- 
ции — кэш-памяти прямого отображения. Вся оперативная память компьютера 
представляется контроллером кэш-памяти разбитой на страницы размером 
65 536 байтов (рис. 8.1). К какой странице принадлежит конкретный 32-битовый 
адрес памяти, можно вычислить, если обнулить его младшие 16 битов. Далее, с точ- 
ки зрения контроллера кэш-памяти, каждая страница представляется разбитой на 
строки по 32 байта (или 64 байта в семействе Мее Вигз(). В примере нарис. 8.1 каж- 
дая страница поделена на 2048 (0—2047) строк по 32 байта каждая. Таким образом, 
емкость страницы — 2048 - 32 = 65 536 байтов. Количество страниц также вычис- 
лить легко — ОРЕЕЕОО00}В = 4 294 901 760. Максимальный объем памяти, с кото- 
рым может работать кэш-память такой организации, — 281 470 681 743 360 бай- 
тов. Это намного превышает предельный объем адресуемой памяти в ГА-32 — 
4 294 967 295 байтов (32-битовый адрес) или, при некоторых условиях, 
68 719 476 735 байтов (36-битовый адрес). Поэтому реально используются лишь 
несколько младших битов из поля «номер страницы». Логически все строки раз- 
ных страниц с одинаковым значением поля адреса «номер страницы» можно объ- 
единить влинейку. Сама кэш-память, показанная на рисунке слева, логически пред- 
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ставляет собой таблицу 32-байтовых элементов. Каждой строке таблицы припи- 
сан дескриптор, в котором выделяются два поля — тег и бит достоверности. Поле 
«тег» содержит номер страницы оперативной памяти, строка которой находится 
в данной строке кэш-памяти. Бит достоверности показывает актуальность строки 
кэш-памяти. С помощью этого бита в начале работы процессора все строки обо- 
значаются недостоверными («грязными»). Важно понимать то, что в каждой стро- 
ке кэш-памяти могут содержаться строки только из одной линейки строк из раз- 
ных страниц оперативной памяти. Действия процессора после формирования 
адреса для чтения из памяти: 


1. Выделение из адреса поля «номер строки». 


2. Обращение к строке таблицы кэш-памяти со значением номера, равным значе- 
нию поля адреса «номер строки». 


3. Проверка бита достоверности — если элемент достоверен, то переход к пунк- 
ту 4. Если бит помечен как «грязный», то считается, что нужной строки памяти 
в кэше нет, и запускается процесс чтения ее из оперативной памяти и замеще- 
ние ею данной строки кэш-памяти. 


4. Сравниваются значения полей «номер страницы» таблицы кэш-памяти и адре- 
са. Если они равны, то нужное слово или байт в строке кэш-памяти есть и про- 
изводится его выборка. Если эти значения не совпадают, то считается, что нуж- 
ная строка отсутствует (промах кэш-памяти) и, как в п. 3, производится запуск 
процесса чтения нужной строки из памяти и замещение ею данной строки кэш- 
таблицы. Предварительно требуется записать вытесняемую строку из кэш-па- 
мяти на свое место в основную память. 


Хранение данных в кэш-памяти значительно ускоряет доступ к данным в ос- 
новной памяти. Фактически в кэше можно хранить одновременно до 65 536 смеж- 
ных байтов оперативной памяти (64 Кбайт). Но если представить ситуацию, когда 
в программе есть близко расположенные команды, работающие с ячейками памя- 
ти, отстоящими друг от друга на расстояние большее, чем 65 536, то мы получим 
значительное снижение производительности. Причина в том, что процессору при- 
дется постоянно обновлять содержимое кэш-памяти и делать это не одним байтом 
или словом, а, как минимум, порциями по 32 байта. Чтобы снизить вероятность 
таких ситуаций (коллизий), кэн-память первого уровня, во-первых, разделяют для 
кода и данных и, во-вторых, применяют наборно-ассоциативную архитектуру кэш- 
памяти. 

Основная идея наборно-ассоциативной архитектуры — поддержка нескольких 
связанных кэш-таблиц, подобных применяемым в архитектуре кэш-памяти пря- 
мого отображения (рис. 8.2). В этой архитектуре становится возможным хранить 
строки байтов из различных страниц памяти с одинаковыми номерами строк. Та- 
кая архитектура кэш-памяти усложняет алгоритм управления ею. При необходи- 
мости чтения из памяти контроллер кэша разбирает адрес на составляющие, так 
как это было в кэше прямого отображения, а затем производит поиск в наборе таб- 
лиц кэш-памяти элемента, номер страницы которого совпадает с нужным. Если 
такового нет, то нужно решать, какой элемент подлежит замещению новыми дан- 
ными. Обычно контроллер реализует политику удаления наиболее давно неисполь- 
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зовавшихся элементов (Г.В — [е2а$ё Везеп у Озе4). Все элементы одного уровня 
{с одним номером строки) связываются в список, каждый элемент которого имеет 
поле, с помощью которого реализуется принцип удаления по давности использо- 
вания. В процессорах Репйит применяется двух- или четырехвходовая наборно- 
ассоциативная архитектура кэш-памяти с размером строки 32 байта (в Меё Виг$Е — 
64 байта). Полную информацию о характеристиках кэш-памяти конкретного про- 
цессора можно получить из документации на него. 


Кэш- Кэш- Кэш- Кэш- 
каталог память ЕВИ каталог память 


Основная 
память 










Номер Данные 
страницы из памяти 


Номер Данные 
страницы из памяти 


Биты Биты 
управления управления 


Рис. 8.2. Архитектура наборно-ассоциативной кэш-памяти (2 входа) 


К чему весь этот разговор о кэш-памяти? Дело в том, что, зная особенности ее 
функционирования и предоставляемые конкретным процессором средства, мож- 
но значительно повысить скорость работы программ определенного класса. Дан- 
ные кэша первого уровня доступны для чтения и перезаписи за один такт работы 
процессора. Работа с памятью обходится значительно «дороже». Поэтому важно 
представлять себе потенциал конкретного процессора и его системы команд отно- 
сительно возможностей влияния на процесс кэширования. 

Начиная с 180486, фирма Ге! вводит средства (в виде команд 1М№УО, МУЕРб 
и \В1№О), с помощью которых можно влиять на процесс кэширования. Далее, осо- 
бенно по мере развития мультимедийных возможностей компьютера, архитектура 
подсистемы кэширования процессоров пе! и номенклатура средств, доступных 
программисту для воздействия на процесс кэширования, только расширялась и со- 
вершенствовалась. На рис. 8.3 и 8.4 показаны архитектуры подсистем кэширова- 
ния процессоров семейств Рб и Меё ВигзЕ. 

Основное отличие подсистемы кэширования процессора семейства Меё Виг$ 
от процессоров семейства Рб состоит в отсутствии кэша команд 1 уровня (Ё1). 
В семействе Ме Виг$( он заменен на кэш трасс (см. ниже раздел «Оптимизация 
для процессоров семейств Рб и Ме Вигз: (Репйит 4)»). 

Перечислим особенности работы кэш-памяти, которые можно использовать для 
увеличения скорости работы программ. 
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Рис. 8.3. Архитектура подсистемы кэширования процессоров семейства Рб 


Оперативная память 





Системная 


< + > шина 


Устройство шинного интерфейса 


Кэш Универсальный ТеВ 
данных ((1) кэш (2) данных 


кэш (13) 
Хеоп 


' 
р 
' 
Универсальный| ! 
р 
Корпус процессора , 


Рис. 8.4. Архитектура подсистемы кэширования процессоров семейства Ме! Вигз{ 


Чтение даже одного байта из памяти приводит к чтению всего кэш-ряда (32 или 
64 байта). Кэш-ряд всегда выровнен на величину, кратную 32 или 64. Получа- 
ется, что чтение остальных 31 или 63 байтов не стоили нам ничего. Отсюда вы- 
вод: данные, обрабатываемые вместе, нужно располагать рядом и выравнивать 
на границу, кратную 32 или 64. 


Необходимо учитывать закономерности заполнения наборно-ассоциативной 
памяти кэш-памяти данными. Каждый кэш-ряд этой памяти ассоциирован 
с вполне определенными адресами оперативной памяти. На заполнение конк- 
ретного кэш-ряда могут претендовать только данные, имеющие одинаковые 
биты «номер строки» адреса (см. рис. 8.1). Поэтому для наборно-ассоциатив- 
ной памяти с двумя входами в кэше могут присутствовать два блока данных 
(32 или 64 байта) с одинаковыми значениями битов адреса «номер строки». Для 
наборно-ассоциативной памяти с четырьмя входами, соответственно, в кэще 
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могут присутствовать до четырех блоков. Если, к примеру, при наличии набор- 
но-ассоциативной кэш-памяти с двумя входами ведется одновременная работа 
с тремя блоками памяти, имеющими одинаковое значение поля адреса «но- 
мер строки», то это будет приводить к постоянной перезаписи обоих кэш- 
рядов, соответствующих данному адресу. Поэтому при планировании програм- 
мы, нужно следить за тем, чтобы адреса массивов данных, с которыми ведется 
работа на достаточно локальном участке программы, имели разные значения 
битов адреса «номер строки». Это сбережет десятки тактов работы процессора. 
Чтобы не очень сильно задумываться о значении адресов, в качестве самой про- 
стой рекомендации можно посоветовать держать данные оптимизируемого уча- 
стка программы вместе, в пределах одного блока, размером не более общего 
размера кэш-памяти. Если все же данных много, то нужно собрать вместе наи- 
более часто используемые их них и разместить их в пределах одного блока. 


* Для процессоров Репйит, вплоть до РЕ, существует отдельный кэш кода пер- 
вого уровня. Для его эффективной работы также по возможности нужно распо- 
лагать критические и часто востребуемые фрагменты кода так, чтобы они мог- 
ли разместиться в его границах. 


» Использовать команды процессора, прямо учитывающие особенности работы 
с кэш-памятью. Существует несколько команд предварительной записи в 
кэш-память данных из оперативной памяти — РКЕРЕТСНО, РКЕРЕТСН1, РЕЕРЕТСН2, 
РВЕРЕТСНА. В ММХ- и ХММ-расширениях процессоров Репиит предусмотре- 
но несколько команд, которые позволяют процессору работать с данными ми- 
нуя кэш, тем самым исключая загрязнение кэша разовыми данными. Пример 
таких команд — МАЗКМОМА, МОУМТО ит. д. 


Критичные циклические участки кода есть смысл делать как можно меныцими 
с тем, чтобы они полностью размещались в кэше. 


Конвейер процессоров семейства Р6б (Репиит ПИЛИ) 


При оптимизации программы для процессоров семейства Рб можно опереться на 
особенности конвейера для этих процессоров. Его схематическое представление 
приведено на рис. 8.5. 

Процессор с помощью устройства выборки команд ищет очередные команды 
для выборки в кэше команд первого уровня. Если его нет, то одновременно орга- 
низуется поиск в кэше второго уровня и формирование адреса очередной инст- 
рукции на шине адреса. Если требуемый код присутствует в кэше второго уровня, 
то он помещается в кэш первого уровня, а процесс выборки команд из памяти пре- 
кращается. После выборки команд из кэша первого уровня вычисляется их длина 
и осуществляется их декодирование. Суть декодирования — перевод каждой ко- 
манды в последовательность более элементарных действий, называемых микро- 
операциями. Помните, сколько было разговоров о преимуществах К15С- и С15С- 
архитектур процессоров лет десять назад. Потом все это поутихло. Причина — 
начиная с процессоров семейства Рб, 1п(е| реализовала основные идеи Е1$С-архи- 
тектуры внутри С1$С-архитектуры. Перед декодированием определяется длина 
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Рис. 8.5. Архитектура конвейера процессоров семейства Рб 


команд и производится их идентификация. Декодированием команд одновремен- 
но занимаются три декодера. Эти декодеры неравнозначны. Только один из них — 
020 может обрабатывать любые команды. Остальные два декодера — 01 и 02, спо- 
собны обрабатывать только команды, генерирующие одну микрооперацию. Декодер 
0 преобразует исходную команду в последовательность из двух и более (опти- 
мально — четырех) микроопераций. Информация о последовательности микроопе- 
раций для реализации конкретной машинной команды содержится в блоке микро- 
программного управления. Кроме команд, декодеры обрабатывают также префиксы 
команд. 

Декодер команд в состоянии формировать до шести микроопераций за такт — 
по одной от простых декодеров и до четырех от сложного декодера. Для достиже- 
ния наибольшей производительности работы декодеров необходимо, чтобы на их 
входы поступали команды, декодируемые шестью микрооперациями в последова- 
тельности 4 + 1 + 1. Поэтому, в целях оптимизации, есть смысл переупорядочи- 
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вать исходный набор команд таким образом, чтобы группы команд формировали 
последовательности микроопераций по схеме 4 + 1 + 1. Тогда не будет простоев 
блока декодирования. Количество микроопераций в той или иной команде можно 
узнать из таблицы, приведенной в файле среди материалов, прилагаемых к книге. 
В ней приняты следующие обозначения: 


цифра от 1 до 4 — количество микроопераций, в которые декодируется команда; 
меньше 4 (<) — в зависимости от операндов команда декодируется в 1—4 мик- 
рооперации; 

больше 4 (>) — команда декодируется в более чем 4 микрооперации. 


Команды ММХ-и ХММ-расширений, которые не обращаются к памяти, деко- 
дируются в одну микрооперацию. Команды ММХ- и ХММ-расширений, осуще- 
ствляющие доступ к памяти, декодируются в две микрооперации. 

Микрооперации выполняются пятью работающими параллельно исполни- 
тельными устройствами процессора: два из них обрабатывают все арифмети- 
ческие операции, третье производит операцию чтения из памяти, четвертое 
выполняет вычисление адреса для чтения из оперативной памяти, пятое запи- 
сывает в память. 


Планирование и учет особенностей 
исполнения команд 


Еще иеще раз нужно подчеркнуть, что универсальных (для всех процессоров) ре- 
цептов оптимизации достаточно мало. Если планировать глубокую оптимизацию 
кода, то предварительно нужно изучить руководство по оптимизации от фирмы- 
производителя, которым сопровождается любой процессор. Например, для про- 
цессора Репйит 4 это [49], доступное в электронном виде на сайте ВЕр:// 
демеорегле(.сот. В нем можно найти рекомендации по использованию (или не- 
использованию) тех или иных команд и особенности их выполнения. В этом раз- 
деле приведем некоторые советы, которые целесообразно учитывать в своей работе. 


Циклические конструкции и переходы 


При оптимизации программы особое внимание следует уделять циклам и перехо- 
дам. Причина этому — конвейеризация вычислений. Условие перехода всегда ста- 
новится известно, когда на конвейер уже подана определенная последовательность 
команд программы. Современные процессоры имеют средства для предугадыва- 
ния переходов для того, чтобы среди этой последовательности команд оказалась 
команда, соответствующая адресу перехода. Практикуются различные подходы 
к принятию решения о предстоящем переходе. Формированием содержимого кон- 
вейера занимается устройство выборки/декодирования. Как только очередная ко- 
манда распознана как команда перехода, должно быть принято решение о месте 
программы, с которого следует начинать выборку очередных команд на конвейер. 
Самый простой варнант действий -— в расчете на то, что переход планируется на- 
зад, он считается наиболее вероятным, и устройство выборки выбирает команды, 
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начиная с этого адреса. И наоборот, переход вперед считается наименее вероят- 
ным, и устройство выборки продолжает обработку команд, следующих за данной 
командой перехода. Если предсказание выполнено неправильно, то цена этой ошиб- 
ки велика — процессору приходится сбрасывать весь конвейер и начинать выбор- 
ку команд с действительного адреса перехода. Поэтому в современных процессо- 
рах технике прогнозирования переходов уделяется большое внимание. 

Вид предсказания, разобранный выше, называется статическим. Использует- 
ся также и другой подход, называемый динамическим предсказанием. Его суть в под- 
держании процессором специальной таблицы переходов. Эта таблица организова- 
на подобно кэш-таблице. Каждая строка таблицы содержит адрес одной из ранее 
встретившихся команд перехода и поле признаков, на основе которого делается 
прогноз о предстоящем переходе. В простейшем случае это поле состоит из одного 
бита, содержимое которого показывает, был ли в действительности переход в пос- 
ледний раз, когда выполнялась данная команда. Для более сложных алгоритмов 
поле признаков может состоять из нескольких битов. 

Зная особенности, заложенные в подсистеме предсказания переходов процес- 
сора, можно подыграть им при написании программы и в определенной степени 
оптимизировать выполнение циклов и переходов. Ниже перечислены некоторые 
рекомендации: 


По возможности нужно вообще избегать переходов, в том числе вызовов про- 
цедур. Небольшие по размеру процедуры лучше вообще заменять макросами. 
При этом гарантированно экономятся такты на вызов процедуры и возврат из 
нее. В отдельных случаях имеет смысл даже дублировать код, на который со- 
вершается переход. 


Для перемещения данных по условию можно использовать команды СМО\сс 
и КМО\сс. 


Команда 10ОР требует много тактов процессора для своего выполнения, поэто- 
му ее следует заменять на сочетание команд ОЕС ЕСХ и 3№7 в конце цикла 


Предпочтительны циклы с проверкой условия выхода в конце тела цикла. При 
большом количестве повторений сглаживается свойство таких циклов — вы- 
полнение его тела хотя бы один раз. 


* Для небольших циклов с ограниченным, тоже небольшим, числом повторений 
часто бывает полезным разворачивание цикла, то есть просто повтор тела цик- 
ла нужное (заранее известное) количество раз. 


Выравнивание данных и кода 


Для облегчения процессору работы с данными в памяти их необходимо выравни- 
вать Выравниванию подлежат все виды данных: одиночные переменные простых 
типов, поля структур, переменные в стеке. Невыравненные переменные заставля- 
ют процессор совершать дополнительные циклы для доступа к ним. Данные По- 
ступают в процессор через кэш данных. Прн выравнивании необходимо учиты- 
вать размер операнда и тип процессора. 
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Размер операнда, Семейство процессоров 
т [6 | м | 
[8 | Любойздре 


Е а и 


выравненных 
4 байтов 
[4 | Крный8 | Крлвый8 | Катыйв | 















Кратный 16 Кратный 16 
ей Кратный 16 Кратный 16 


При размещении локальных переменных процедуры в стеке возможны потери 
производительности из-за проблем выравнивания данных в стеке. Поэтому важно 
соответствующий кадр стека выравнивать на определенную границу (8/16/32/ 
64 бита). Для этого в вызываемой процедуре можно использовать следующие коды 
пролога и эпилога: 





а119п 16 : выровняем точку входа в процедуру 
му_ргос ргос 
Тоса1_Ргате еди 20 ; к примеру. зарезервируем 20 байтов 
: для локальных переменных 
1*----- пролог 
рии ебр : сохраним предыдущий кадр 
: (для вложенных процедур) 
пом ебр. езр 
апд ебр.ОТЕЕЕЕСОИ ; выравнивание на 64-битовую границу 
ЮУ [ебр]. езр ; сохраним старый указатель на стек 
$иБ езр. 1оса}_Тгате : место для локальных переменных 


------ доступ к локальным переменным относительно еБр 


:------ эпилог 


оу езр. [ебр] ; восстановили старый указатель на стек 
рор ебр ; восстановили указатель на предыдущий 
: кадр стека 
ге? 
му ргос ргос 


Оптимизация для процессоров семейств Рб 
и Ме{ Виг$т (РепНнит 4) 


Системы команд процессоров семейства Рб и процессора Репйим 4 содержат ряд 
команд, которые следует исключить из оптимизируемой программы по причине 
их медлительности: 


команды ТЕА\Е и ЕМТЕК изначально были предназначены для поддержки блоч- 
ной структуры программы (работы с кадром стека) для использования в язы- 
ках верхнего уровня; 

цепочечные команды без префикса повторения выполняются медленнее команд 
загрузки и сохранения и по возможности их следует заменять эквивалентными 
фрагментами кода. Из всех цепочечных команд наиболее быстрыми являются 
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те, у которых достаточно большое число повторений и которые оперируют двой- 
ными словами (то есть оптимально работают с кэшем); 

" команда 100Р не рекомендуется для организации циклов; 
команды работы с битами ВТ, ВТС, ВТВ, ВТ$, а также команды сдвига ВСВ и ВСЁ со 
значением счетчика сдвига выполняются более медленно, чем обычные логи- 
ческие команды и команды сдвига на единицу, и их следует избегать; 

” команду целочисленного умножения 1МИЁ также желательно заменять на экви- 
валентный код ($НЕ, АО, $08, 1ЕА или масштабирование); 
использовать, где возможно, команды, одним из операндов которых является 
регистр ЕАХ (аккумулятор) или регистр в принципе. Эти команды, как правило, 
короче и выполняются быстрее; 
команда 1ЕА хорошо подходит для вычисления сумм, разностей и произведе- 
ний (например, вместо 1МИ\.) для трех операндов: 


С (ваеах, [еах+ебх] — складываются ЕАХ и ЕВХ; 
С (ва еах, [еах+еах*2] — вычисляется утроенное значение ЕАХ; 
С \ва еах, [еах-еБх+2] — к разности ЕАХ и ЕВХ прибавляется 2; 


С (6аеБх, [е4х+1] — производится присвоение значения одного регистра друго- 
му с одновременным инкрементом. 

Следует заметить, что 1ЕА с масштабным множителем на Реп(йит 4 выполняет- 

ся медленнее, чем на процессорах семейства Рб. Поэтому для масштабирова- 

ния рекомендуется использовать последовательность команд АБО. 


Отметим основные отличия Репйит 4 от Репйит Ш: 
Введение кэша трасс ({гасе сасве) в Репйит 4 снизило важность выстраива- 
ния команд по схеме 4 +1+1 
Предпочтительными являются переходы вперед и циклы. 


Уменьшено влияние зависимостей между регистрами; желательно использо- 
вать полные 32-разрядные регистры и команды для работы с ними; 8- и 16-би- 
товые регистры фактически противопоказаны. Чтобы поместить 8- и 16-бито- 
вые операнды в 32-разрядный регистр, можно использовать команду МО\7Х. 


Изменились задержки времени выполнения некоторых команд. В Репиит 4 вд- 
ва раза быстрее стали выполняться следующие арифметические команды: АБ, 
ИВ, СМР, ТЕЗТ, АМО, ОВ, ХОК, МЕС, МОТ, $АНЕ, МОУ. И наоборот, увеличилось время 
выполнения команд сдвига, циклического сдвига и традиционно медленного 
целочисленного умножения. Определенной осторожности в своем применении 
требует команда Е ЕА. 
Для Репиит 4 следует избегать применения команд МС и 0ЕС. Вместо них нуж- 
но использовать команды Аб и $08 соответственно. Дело в том, что команды 
МС и 0ЕС модифицируют только подмножество флагов в регистре ЕР-Аб$, по- 
этому может возникнуть нежелательная зависимость последующих перед ними 
команд от предыдущих. Команды Аб и $18 перезаписывают все флаги, что ис- 
ключает появление подобных зависимостей. 

 Нестоит без особой надобности употреблять сложные команды типа ЕМТЕК, ТЕАУЕ 
или 1ООР, то есть те команды, которые требуют более четырех микроопераций 
для своего выполнения. 
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* Команды сдвига — традиционно медленные, и с ними лучше не связываться. 
На Репиит 4 они выполняются еще медленнее. Если нет возможности обой- 
тись без них, то лучше использовать самые быстрые из них — сдвиги на 1 (на- 
пример, разбивать сдвиг на два разряда на два одиночных сдвига). 


Целочисленное умножение исполняется сопроцессором, поэтому это оченьмед- 
ленная операция и, как уже говорилось, ее желательно заменять сложениями 
(в разумных пределах) или командой 1ЕА (см. выше). 


Очистку регистра следует производить командами ХОК, $08 и РХОК. Процессор 
Репиим 4 при обнаружении в качестве операндов этих команд одинаковых ре- 
гистров понимает, что от него хотят и, разрывая цепочку зависимостей, очища- 
ет нужный регистр. 

Для сравнения некоторой величины с нулем или константой рекомендуется 
использовать команду ТЕЗТ. Команда ТЕЗТ выполняет логическую операцию «И» 
над операндами. Ее отличие от команды АМ в том, что результат никуда не 
записывается, производится только установка флагов (см. описание команд 
в учебнике). Сравнивать операнды можно и командой СМР, но ТЕЗ имеет мень- 
ший размер и хорошо спаривается. В то же время, не нужно забывать о том, что 
многие команды при формировании своего результата анализируют значения 
операндов и устанавливают флаги, поэтому в ряде случаев об их операндах и ре- 
зультате можно судить по состоянию этих флагов и применять команды услов- 
ного перехода дсс. Например, при использовании МО\ и ТЕА для анализа операн- 
дов предпочтительна команда ТЕЗТ. 


Для Репиит 4, в котором имеется кэш трасс, можно улучшить производитель- 
ность при работе с операндами в памяти. Это касается случаев, когда схема ко- 
манды следующая: коп гед, тет. В Репбим 4 (как, впрочем, и в семействе Рб) 
существует пул рабочих регистров (КОВ), доступных только процессору. Все- 
го имеется порядка 40 регистров, в которых и хранятся операнды всех команд, 
загруженных в процессор. Поэтому, вопреки мнению, что команда быстрее все- 
го выполняется над операндами в регистрах, для данной схемы команд нет смыс- 
ла производить дополнительную пересылку второго операнда в регистр. 


В соответствии с общими рекомендациями следует использовать команды, тре- 
бующие минимального количества микроопераций и работающие с регистро- 
выми операндами. 


Если программа активно ведет работу с памятью, то желательно сгруппировать 
эти команды в блоки операций чтения и операций записи. 


Для ускорения выборки операндов из памяти хорошо подходят команды пред- 
варительной загрузки РКЕГЕТСНп тет. С помощью данной команды можно зара- 
нее произвести заполнение строки кэш-памяти данными из памяти. Поэтому, 
если есть возможность, то необходимо вычислять адреса данных в памяти как 
можно раньше и загружать их в кэш одного или нескольких уровней этой ко- 
мандой. 

*” Некоторые команды поддерживают сериализацию (строго последовательное 
выполнение). Они начинают свою работу только после завершения всех мик- 
роопераций, инициализированных к данному моменту времени. Это команды 
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работы с дескрипторными таблицами 601, 10Т, ТОТ, загрузки в системные регис- 
тры МО\, работы с кэшем 1№\0, ТМ\ЕРб, \УВТЮО и некоторые другие. 


При планировании размещения данных необходимо следить за тем, чтобы поле 
данных не оказалось разделено по двум строкам кэш-памяти. 


’ Помните о командах ММХ- и ХММ-расширений при необходимости выпол- 
нения одних и тех же операций над массивами данных. В особенности это ка- 
сается арифметических, логических операций, операций манипулирования 
данными. Есть смысл внимательно отнестись к этим командам с тем, чтобы 
использовать их не только в коде ассемблера, но и при программировании ас- 
семблерных вставок в программах на языках высокого уровня. 


Цепочки зависимости. В процессорах семейства Рб и Репиит 4 реализовано 
выполнение кода не по порядку его следования в исходной последовательнос- 
ти команд. Попросту говоря, в процессоре практически одновременно (разны- 
ми исполнительными устройствами) «по предположению» выполняются не- 
сколько команд. Упреждающее выполнение блока команд тем быстрее, чем 
меньше команды зависят друг от друга. Если команды фрагмента программы 
зависят друг от друга по данным, то говорят, что между ними образовалась це- 
почка зависимости: 


пом еах. ор1 
5иВ еах. орё 
ада еах. орЗ 


Это типичная цепочка зависимых команд при арифметических вычислениях. 
В случае команд $5В и АСВ это не так страшно, так как они требуют мало микро- 
операций. Что же касается команд умножения и деления, то здесь ситуация усу- 
губляется, так как количество микроопераций для их выполнения исчисляется 
десятками, и лучше выполнить три сложения, чем умножение на три. Умножения 
и деления следует по возможности заменять более «дешевыми» эквивалентами — 
сдвигами, сложениями, командой 1 ЕА. 

Большинство приведенных выше положений достаточно относительны. От- 
носительны относительно стиля программирования, целевого процессора, це- 
лей разработки и т. п. Объективную оценку качества оптимизации кода может 
дать только эксперимент. Существуют специальные средства измерения про- 
изводительности, но во многих случаях достаточно собственных «доморощен- 
ных» средств. Одним из таких инструментов является пример программы-про- 
файлера, приведенный в следующем разделе. Подробное ее обсуждение вы 
найдете в учебнике. Приступая к оценке кода, необходимо помнить об эффек- 
те «выполнения кода в первый раз». Он имеет место при выполнении циклов 
или наличии в программе повторяющихся участков памяти. Исполнение кода 
первый раз занимает гораздо больше времени, чем его последующие исполне- 
ния. Объяснение этому простое — необходимость первичного заполнения кэш- 
памяти. При повторном исполнении кода он уже находится в кэш-памяти пер- 
вого или второго уровня, и его выборка в процессор производится намного 
быстрее. Более того, при первом проходе кода информации о переходах нет в 
буфере предсказания переходов, и вероятность правильного предсказания пе- 
реходов очень мала. 
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Функционирование профайлера (иначе профилировщика) основано на работе со 
счетчиком меток реального времени Т5С (Тите Затр Сошжщег), представляющего 
собой регистр, содержимое которого инкрементируется с каждым тактом процес- 
сорного ядра. Всякий раз при аппаратном сбросе (сигналом ВЕЗЕТ) отсчет в этом 
счетчике сбрасывается в ноль. Разрядность регистра обеспечивает счет без пере- 
полнения в течение сотен лет. Счетчик продолжает отсчет как при исполнении 
инструкции НИ, так и при остановке процессора по сигналу $ТРСЕК# (для энерго- 
сбережения). Чтение счетчика обеспечивает команда ВОТ$С, которую можно сде- 
лать привилегированной (доступной лишь при СР = 0) установкой бита СВ4.Т50. 
Присутствие счетчика 15С определяется по инструкции СРИУТО (ЕАХ = 1). Если в ре- 
зультате ее вызова бит 4 регистра Е0Х равен 1, то процессор поддерживает счетчик 
меток реального времени Т$С. 

Команда ВОТ$С (Кеа) Нот Типе ЗЕатр Соштег — чтение 64-разрядного счет- 
чика меток реального времени Т5С (те 5{атр Сошжег)) не имеет операндов. 
Машинный код этой команды — 031. Команда проверяет состояние второго бита 
регистра СК4.Т50 (Тите 5батр ОваЫе — отключить счетчик меток реального вре- 
мени): 

если СВ4.Т5 = 0, то выполнение команды В ОТ$С разрешается на любом уровне 

привилегий; 

" если СВ4.Т$О = 1, то выполнение команды ВОТ$С разрешается только на нулевом 
уровне привилегий. 

Когда выполнение команды разрешено на текущем уровне привилегий, произ- 
водится сохранение значения 64-битового МЗВ-счетчика Т$С в паре 32-битовых 
регистров ЕОХ:ЕАХ. Если выполнение команды запрещено, то работа команды за- 
канчивается. 

Напишем две макрокоманды, использование которых позволит нам получать 
количественную оценку работы кода, начиная от полной программы и заканчивая 
отдельной командой. Эти макрокоманды не будут отличаться компактностью, но 
этого от них и не требуется, так как они являются лишь средством оценки эффек- 
тивности оптимизации кода, востребуемым на этапе отладки, и в конечном коде 
их наличие не требуется. 

Применение наших макрокоманд можно подчинить следующему алгоритму. 
Вызов первой макрокоманды, назовем ее ргоР(ег_1п, должен зафиксировать момент, 
относительно которого будет производиться отсчет тактов процессора, то есть 
в начале профилируемого участка программы. Вызов второй макрокоманды 
ргоР(ег_оц{ должен зафиксировать момент окончания работы на этом участке про- 
граммы. Необходимо иметь в виду, что это «грязное» время работы программы, по 
которому можно производить только приблизительную оценку ее скорости рабо- 
ты. Для этого есть внутренняя и внешние причины. Внутренняя причина заключа- 
ется в том, что полученная величина включает в себя время, затраченное на работу 
некоторых команд, составляющих тело самой макрокоманды. Этот недостаток ис- 
править легко. Что касается внешних причин, то они объективны по отношению 
к программе пользователя и мешают получению истинного времени профилиро- 
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вания. Такими внешними причинами являются программы операционной систе- 
мы, которые могут приостанавливать на время программу пользователя. 

Ниже приведены макрокоманды ргоМег_т и ргоег_оиё с тестовым примером 
для проверки их работы. Данные макрокоманды производят корректировку ре- 
зультата своей деятельности, с тем чтобы исключить обсужденные выше внутрен- 
ние причины «грязного» времени работы программы. Заметим, что не всякий транс- 
лятор ассемблера «знает» о новых командах процессора, в том числе и о комайде 
КОТ$С. По этой причине мы ее моделируем, инициализируя в сегменте кода два 
байта значениями машинного кода этой команды — 46 ОТ, 311. 








еее - + 
:| Программа: рг908 01.азт. Демонстрация использования макрокоманд | 
| рго1ег_1п и ргоРИег_оиё для оценки производительности фрагментов кода. | 

еее + 

еее + 
:| Макрокоманда: гОЁзс. Эмуляция гс. | 
Пенн - + 

га$с тасго 

[4 от. зв 

епат 

еее неее ненн се + 
:| Макрокоманда: Блп_дес_Три. Вывод на консоль десятичного числа. | 

еее + 
Ч — адрес 64-битовой ячейки (описанной 9) | 

: с Я двоичным целым числом. | 

| ${г1пд_раск - адрес 80-битовой ячейки (описанной 4). | 

: в которую сохраняется упакованное 10-е значение. | 

_ адг_5{г1па_раск -— ячейка с адресом $&г1пд_раск (описанная 99). | 

м 1еп_${г1ид_раск -— длина ${г1ид_раск. 

=] адг_$+г1пд — ячейка с адресом $Ёг1пд (описанная 99). 

В В ${г1пд помещаются символы десятичных цифр для вывода . | 
] 1еп_$1г1й9 — размер $&г1пд (18 байтов). | 
ее ----- + 

п ‚Фес Три масго — $&г1пд зи дмогд:КЕЦ. $&г1пд_раск:ВЕО.\ 

адг_$фг1па_раск:КЕО. 1еп_$г1пд_раск : ВЕД. \ 
а@г $1гт9:ВЕО. Теп_51г1пд:КЕЙ 

]0са1  суст 
-----* преобразуем Б1п->4ес 

Пи 

1119 — $г1тд_Б1т_диог@ : заносим в сопроцессор 

: двоичное целое число 

165$2р  <{глид раск : извлекаем упакованное десятичное 
кается распакуем 

145 $1. адг_$&г1ид_раск 

ада $1, 1еп_$ёг1пд_раск - 2 ; на конец $1г1па_раск 

: (18 упакованных десятичных цифр) 
Те 91. абг_$%г1п9 
оу сх. 9 : 9 пар упакованных десятичных цифр 
сус1: хог ах.ах 

$9 : $ёг1п9_раск обрабатываем с конца 

10956 :; в а! очередные 2 упакованные десятичные цифры 
ИИ распаковываем — ап = младшая. а] = старшая 

$51 ах. 4 

го] а1, 4 

ог ах. 30308 : преобразуем в символьное представление 

хсНо ан. а] : ай = младшая. а! = старшая 

с14 ; в $1г1п9 записываем с начала 

$60$и 

Чес сх 


Ку сус1 








Профайлер 
4----- выводим на консоль 
ПЮУ Бх. 1 : стандартный дескриптор — экран 
ОУ сх. 1еп_$г1по 
19$ 4х. адг_$1г1пд : формируем указатель на строку $1г1п9 
ОУ ан. 408 : номер функции 005 
ия ан 
3с ех1т : переход в случае ошибки 
ехл1{: 
еподт 
еее еее ----- + 
| Макрокоманда: ргот11ег_1п. Засечка номента начала профилирования. | 
к О С Ао и О О аа а И НЫЙ а ео ан + 
Вход: \а1_1 - ячейка памяти 64 бита (2х32) для сохранения ] 
момента начала профилирования (“грязного”). | 
с: 3 + 
рго1ЧТег_ 17 пасго  ма\_1:ВЕС 
;------ сохранение всех регистров общего назначения в стеке 
: функционально не требуется. включено в код для 
; примера компенсации влияния на время профилирования 
; других команд 
ризваа 
гае$с 
оу уа1_1 +4, ебх 
оу уа1_1. еах 
-----+ восстановление всех регистров общего назначения 
рорад 
епдт 
вы 
:| Макрокоманда: рго ег ош. Действия при окончании профилирования. 


| Вход: ма1_1 - ячейка памяти 64 бита (2>3г). в которой при входе в макрос 

сохранен момент начала профилирования командой ргоЁЗТег_1п. 

Далее в макросе эта ячейка содержит результат профилирования -— 

число тактов процессора. 

\а1_2 - ячейка памяти 64 бита (2х32). в которой сохраняется момент | 
| 


("грязный") окончания профилирования. 
ее - + 
ргоЧТег_ оу — тасго  уаТ_1: КЕО. ма!_2: ВЕД 
------ сохранение всех регистров общего назначения в стеке 
ризваа 
1------ окончание профилирования 
гаЕ$С 
оу уа]_2 +4. ебх 
оу уа1_2. еах 
ыы профилируем рипа и рорад 
ризпад 
рора@ ь 
г4Е$с 


1+----- теперь необходимо получить чистое время профилирования. 

: для чего результат необходимо скорректировать (уменьшить) 
: на количество тактов пронессора. требуемое для выполнения 
: пар команд РУЗНАВИРОРАО и МОУ 


$6 еах. уа1_2 

$66 ебх. ма1_2 +4 ; в едх:еах кол-во тактов для выполнения 
: 2-х команд ризпад\рорай 

56 уа1_2.еах 

$66 уа1_2 +4. едх ; собственно корректировка 

оу еах. уаТ_1 

$иЬ уа1_2. еах 

оу еах, уз? 1+4 

566 \а1_2 +4. еах ; в уа}_2:уа1_2+4 — чистое количество 


: тактов процессора для выполнения 
; профилируемого участка 
1------ восстановление всех регистров общего назначения 
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рораа 
о ВЫВОДИМ 
Ь1п_4ес_Три уа1_2_49. $&г1пд раск. ааг_$%г1пд_раск.\ 
Теп_${г1пд_раск. адг_5%г1па. 1еп_$г1пд 


епат 
„Чата 
уа1_2 Табе] — ога 
уа1_2_4 99 0 
уа]_1 Табе!  Фюога 
949 0 
$&г1ид_раск & 0 : исходное значение из ма1_2 4 


: В упакованном десятичном формате 
1Теп_5%г1ид_раск = $ - $&г1пд_раск 
адг_$г1пд_раск аа ${г1пд_раск 
$119 [69] 18 @р (0) ; максимальный результат состоит 
: из 18 десятичных цифр 
Теп_5%г1пд = $ - $9 
ааг_$%г1пд да 5ег1пд 
.соде 


------ профилируем выполнение команд работы со стеком 
рго1Тег_1п уа1_1 
ризВ еах 
рор вах 
рго{1Тег_оцё уа1_1. уа1_2 
ех1{: В ; выход из программы 

Составьте тестовые примеры и «поиграйтесь» с данной программой. Обратите 
внимание, что при задании пустой последовательности команд между парой мак- 
росов ргоег_4п и рго (ег_оцё все равно получается некоторая величина профили- 
рования. Она постоянна, ее источник — сами команды ВОТ$С, которые требуют так- 
тов процессора для своего исполнения. Эту величину можно скорректировать 
разными способами, но можно и не трогать, а учитывать при подведении оконча- 
тельных результатов тестирования нужного вам фрагмента кода. На компьютере 
автора эта величина равна 2. 

В представленной программе для визуализации результатов профилирования 
разработана макрокоманда Ып_4ес_ри, производящая перевод значения из двоич- 
ной системы в десятичную. 

В качестве вывода к данной главе хотелось бы еще раз подчеркнуть, что это 
далеко не полный разговор об оптимизации, а лишь фрагменты верхушки айсбер- 
га этой безбрежной темы. Впрочем, их достаточно для того, чтобы задуматься о не- 
обходимости и способах помощи процессору в исполнении написанного вами кода. 





Глава 9 
Вычисление СВС 


Где начало того конца, которым оканчивается начало? 
Козьма Прутков 


В своей практической работе каждый пользователь наверняка сталкивался с ситу- 
ацией, когда неблагоприятные условия перемещения файлов (любым способом) 
приводили к порче последних. Типичное проявление этой ситуации — сообщение 
об ошибке при попытке чтения некоторого файла. Причина — внесенная извне 
техническая ошибка, приведшая к нарушению целостности исходной информа- 
ции. Существует много методов для исправления подобных ошибок, но прежде 
чем исправлять, необходимо эти ошибки обнаружить. Для этого также существу- 
ют определенные методы [44], основанные на избыточности передаваемой инфор- 
мации, что позволяет не только выявлять наличие факта искажения информации, 
но и в ряде случаев устранять такие искажения. Перечислим наиболее известные 
из методов обнаружения ошибок передачи данных. 


Посимвольный контроль четности, называемый также поперечным (рис. 9.1), 
подразумевает передачу с каждым байтом дополнительного бита, принимаю- 
щего единичное значение по четному или нечетному количеству единичных 
битов в контролируемом байте. Может использоваться два типа контроля чет- 
ности — на четность и нечетность. Алгоритм вычисления контрольного бита 
при контроле на четность предполагает его установку таким образом, чтобы 
общее количество битов в битовой последовательности (включая и сам бит 
четности) было четным. И наоборот, контроль на нечетность подразумевает уста- 
новку контрольного бита так, чтобы общее количество битов в битовой после- 
довательности (включая и сам бит четности) являлось нечетным. Посимволь- 
ный контроль четности прост как в программной, так и ваппаратной реализации, 
но его вряд ли можно назвать эффективным методом обнаружения ошибок, так 
как искажение более одного бита исходной последовательности резко снижает 
вероятность обнаружения ошибки передачи. Этот вид контроля обычно реали- 
зуется аппаратно в устройствах связи. 


Поблочный контроль четности, называемый продольным. Схема данного конт- 
роля (рис. 9.2) подразумевает, что для источника и приемника информации за- 
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ранее известно, какое число передаваемых символов будет рассматриваться ими 
как единый блок данных. При этом для каждой позиции разрядов в символах 
блока (поперек блока) рассчитываются свои биты четности, которые добавля- 
ются в виде обычного символа в конец блока. Схема выполнения продольного 
контроля по-прежнему предполагает наличие у каждого из этих символов до- 
полнительного бита четности (см. выше). По сравнению с посимвольным кон- 
тролем четности поблочный контроль четности обладает большими возможно- 
стями по обнаружению и даже корректировке ошибок передачи, но все равно 
ему не удается обнаруживать определенные типы ошибок. Кроме того, этот вид 
не реализуется эффективно в аппаратных решениях, в силу чего редко исполь- 
зуется. Главное его достоинство в том, что с него можно начинать рассмотрение 
идеи обнаружения ошибок на уровне блоков передаваемой информации. 


1 о ото 100 | — Исходный символ с добавленным битом четности 


(проверка на нечетность) 


Я бото бт 0:0 | Полученный приемником символ 
НеЕИеНОНИРЕКЕЕЕ (передача без искажений) 


— [0] —- Совпадают 
101001 070 |— Полученный приемником символ 
еее четиинннн и? (искажен 1 бит) 
[1]— Не совпадают 
Н 101101 010 |— Полученный приемником символ 
иена? (искажено 2 бита} 


[0| — Совпадают типы четности, но не совпадают 
сами символы — исходный и конечный 























Рис. 9.1. Схема выполнения посимвольного контроля четности при передаче информации 


Бит четности символов 
{проверка на нечетность) 


Информационные 
биты 


Передаваемые 
СИМВОЛЫ 


"Г ч_ Символ четности блока 
-” {проверка на нечетность) 





Рис. 9.2. Схема выполнения поблочного контроля четности при передаче информации 


* Вычисление контрольных сумм. В отличие от рассмотренных выше методов, для 
метода контрольных сумм нет четкого определения алгоритма. Каждый разра- 
ботчик трактует понятие контрольной суммы по-своему. В простейшем виде 
контрольная сумма — это арифметическая сумма двоичных значений контро- 
лируемого блока символов. Но такой метод обладает практически теми же не- 
достатками, что и предыдущие, самый главный из которых — нечувствитель- 
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ность контрольной суммы к четному числу ошибок в одной колонке и самому 
порядку следования символов в блоке. 


Контроль циклически избыточным кодом — СКС (Сусйса! Кедип4апсу СйесЕ). 
Это гораздо более мощный и широко распространенный метод обнаружения 
ошибок передачи информации. Он обеспечивает обнаружение ошибок с веро- 
ятностью до 99%. Кроме того, данный метод обладает рядом других полезных 
моментов, которые могут найти свое воплощение в практических задачах. Рас- 
смотрению этого метода и будет посвящено дальнейнее изложение. 


Сама по себе аббревиатура «СВС» знакома многим пользователям компьюте- 
ра, особеннотем, кому приходится часто переносить свои архивные файлы посред- 
ством гибкого диска. В один прекрасный день попытка распаковки архивного файла 
наверняка приводила к выводу на экран сообщения о том, чтоу этого файла какое- 
то неправильное значение СВС. Что же представляет собой это загадочное значе- 
ние СКС, какую пользу можно извлечь из знаний о нем? В данном разделе мы 
постараемся с этим разобраться, тем более, что поставленная задача является хо- 
рошей возможностью очередной раз продемонстрировать возможности и преиму- 
щества ассемблера по обработке данных на уровне битов, строк битов, последова- 
тельности байтов (в том числе и неопределенной длины). 

СВС (СусЁс Кедип4апсу Со4е) — последовательность битов, полученная по оп- 
ределенному алгоритму на основании другой (исходной) битовой последователь- 
ности. Главная особенность (и практическая значимость) значения СВС состоит 
в том, что оно однозначно идентифицирует исходную битовую последователь- 
ность и поэтому используется в различных протоколах связи, таких как НОГ.С 
и МОРЕМ, а также для проверки целостности блоков данных, передаваемых 
различными устройствами. В силу этих свойств алгоритм вычисления СКС часто 
реализуется на аппаратном уровне. Если взять пример с архиватором, то его рабо- 
та в общем случае заключается в следующем: архиватор упаковывает файлы в со- 
ответствии с некоторым алгоритмом архивации, вычисляя для каждого обрабаты- 
ваемого файла значение СВС. После этого сжатые файлы могут множество раз 
копироваться, пересылаться по сети, в том числе с использованием электронной 
почты, и т. д. В процессе своих путешествий файл может столкнуться с различны- 
ми неприятными воздействиями внешней среды, например с неисправным диско- 
водом, искажением его внутреннего содержимого во время передачи по сети ит. п. 
Эти изменения необязательно должны быть глобальными, они могут касаться всего 
одного бита. Когда приходит время, пользователь распаковывает архив, при этом 
архиватор в первую очередь проверяет целостность файлов в нем. Архиватор опять 
по содержимому файла вычисляет его СКС и сравнивает полученное значение с 
тем значением СКС, которое было вычислено при упаковке файла. Если они рав- 
ны, то считается, что целостность файла не была нарушена, и он распаковывается, 
в противном случае, если новое и старое значения СВС не совпадают, то считает- 
ся, что архивный файл поврежден, и процесс его распаковки завершается. Необхо- 
димо отметить, что СВС не обязательно рассчитывать для больших массивов дан- 
ных, каким является файл. Его можно вычислять и для отдельных строк текста 
и даже слов с целью организации простейшего контроля целостности и отожде- 
ствления символьных (числовых) последовательностей. Более того, из рассмотре- 
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ния ниже вы увидите, что алгоритм вычисления СВС, по сути, является еще од- 
ним методом хэширования, которые мы подробно рассматривали в разделе «Таб- 
лицы с вычисляемыми входами» главы 2. Таким образом, алгоритм вычисления 
СВС имеет много достоинств, которые могут найти применение в самых различ- 
ных практических задачах. 

Основная идея вычисления СКС заключается в следующем. Исходная после- 
довательность байтов, которой могут быть и огромный файл, и текст размером в не- 
сколько слов и даже символов, представляется единой последовательностью би- 
тов. Эта последовательность делится на некоторое фиксированное двоичное число. 
Интерес представляет остаток от деления, который и является значением СКС. 
Все, что теперь требуется, — это некоторым образом запомнить его и передать вме- 
сте с исходной последовательностью. Приемник данной информации всегда мо- 
жет таким же образом выполнить деление и сравнить его остаток с исходным зна- 
чением СКС. Если они равны, то считается, что исходное сообщение не повреждено, 
и т. д. Но этот лишь общая схема. Реальный алгоритм вычисления СВС использу- 
ет особые правила арифметики, в соответствии с которыми производятся все вы- 
числения, назовем их правилами СЕС-арифметики. В силу принципиальной важ- 
ности этих правил для нашего изложения коротко рассмотрим их отличия от правил 
обычной двоичной арифметики. 


СВС-арифметика 


Расчеты СКС ведутся в двоичной системе счисления. При проведении СВС-вы- 
числений используется специальная САС-арифметика, которая, по сути, являет- 
ся полиномиальной арифметикой по модулю 2. Полиномиальная арифметика по 
модулю 2 — это еще один из видов арифметик, востребуемых для решения задач 
в определенной предметной области и отличающихся от привычной двоичной 
арифметики с циклическим переносом отсутствием переносов и вычислением всех 
коэффициентов по модулю 2 [5]. В главе 10 «Расширение традиционной архитек- 
туры Ге» этого практикума при рассмотрении ММХ-команд вы познакомитесь 
с одной из таких альтернативных арифметик — арифметикой с васыщением. Пока 
же остановимся на особенностях СКС-арифметики. 

Итак, как отмечено выше, в основе СВС-арифметики лежит полиномиальная 
арифметика [5, 44]. По определению, полином — линейная комбинация (сумма) 
произведений целых степеней заданного набора переменных с постоянными ко- 
эффициентами. Частный случай — полином, содержащий одну переменную: 

тих чи аи, 

Здесь и„, и, и, — элементы некоторой алгебраической системы 5, называемые 
коэффициентами; х — переменная полинома, которую можно рассматривать как 
формальный символ без определенного значения. Алгебраическая система 5 обычно 
представляет собой множество целых или рациональных чисел в диапазоне 0...т — 
— 1 со сложением, вычитанием и умножением, выполняемыми по модулю т. Для 
нашего рассмотрения особенно важна полиномиальная арифметика по модулю 2, 
в которой каждый коэффициент полинома равен одному из двух значений — 0 
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или 1. Например, шестнадцатеричное значение 0еЗЁ может быть представлено сле- 
дующим полиномом: у 
1х 27 +1х 26+ 1х25+0х2‘+0х23+0х22+1хж21+1х20. 


Если ввести в качестве переменной х = 2, то получим следующий двоичный 
полином: 


1хл7 + 1х8 + 1х2 + 0х + 0х3 +0хл? + 1х! + 1 ха2. 


Вэтом полиноме, строго говоря, значение х не играет особой роли, так как дан- 
ное двоичное число можно представить полиномом в другой системе счисления, 
например шестнадцатеричной: Е хл! + 2х2), гдех = 16. Заметим, что в том и дру- 
гом случае цифры 0, 1, Е, 2 — это просто цифры двоичной и шестнадцатеричной 
систем счисления. 

Так как слагаемые двоичного полинома с нулевыми коэффициентами не дают 
никакого вклада в конечный результат, то их можно попросту отбросить, оставив 
только слагаемые, переменные которых имеют единичные коэффициенты: 

1х7 + 1х6 + 1х5 + 0х4 +0хж + 0х2 + 1х! +1х0 = 

—=1х47+1х48+1х2+1х4'+1хл20 = 

а ОИ + 


Здесь х = 2. Над полиномами можно производить арифметические операции: 
сложение, умножение и вычитание. Процессы выполнения этих операций для поли- 
номиальной арифметики и обычной арифметики многократной точности (см. гла- 
ву 1) похожи. Главное отличие в том, что из-за отсутствия связи между коэффи- 
циентами полинома понятие переноса в полиномиальной арифметике отсутствует. 

Например, для умножения 71 (0111Ъ) на 5В (01015) выполняются действия: 

ж+ж) х (+0) = Ач +жм +0) = 

НЕ 

Для того чтобы получить в ответе 35, мы должны х взять равным 2 и привести 
коэффициенты у членов полинома 2-х и2. д? к двоичным, сделав перенос соот- 
ветствующих единиц в старшие разряды: 

01010 — переносы 

+ 

11111 результат 


100011 =35,. 


В результате получим двоичный полином 25 + х' + 20. 

Эти рассуждения призваны сформулировать очередной тезис о том, что пере- 
носы, как и в обычной арифметике, можно выполнять в случае, когда известно 
основание системы счисления. То есть до тех пор, пока мы не знаем х, мы не можем 
производить и переносы. В приведенном выше примеремы не знаем, что 2 -^2и 2-х) 
на самом деле являются хи х' до того момента, пока не известно, что х = 2. То есть 
в полиномиальной арифметике коэффициенты при разных степенях изолирова- 
ны друг от друга и отношения между ними не определены. Из-за этого возникает 
первая странность полиномиальной арифметики — операции сложения и вычита- 
ния в ней абсолютно идентичны, и вместо них можно смело оставлять одну. 
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Например, сложение по правилам полиномиальной арифметики по модулю 2, бу- 
дем ее далее называть СВКС-арифметикой, будет выполнено так: 

11111011 

+ 

11001010 


00110001 


Из этого примера видны правила сложения двоичных разрядов в арифметике 
с отсутствием переносов: 


0+0=0;0+1=1;1+0=1;1+1=0. 
Операцию вычитания демонстрирует следующий пример: | 
11111011 | 


11001010 


00110001 | 
Правила выполнения вычитания в арифметике с отсутствием переносов: 
0-0=0;:0-1=1;:1-0=Е1-1=0. 

Сравнение примеров для сложения и вычитания полиномов по модулю 2, а так- 
же правил, по которым они выполняются, показывает, что эти две операции СКС- 
арифметики идентичны и по принципу формирования результата они аналогич- 
ны команде ассемблера ХОК. Цель, которой достигают всеми этими условностями, — 
исключить из поля внимания все величины (путем заемов/переносов), лежащие 
за границей старшего разряда. 

Умножение в арифметике с отсутствием переносов также выполняется с уче- 
том особенностей СВС-сложения: 


1101 


1111111 


Видно, что в самом умножении специфики нет, а вот сложение промежуточных 
результатов производится по правилам СЁКС-сложения. 

Для нашего рассмотрения особый интерес представляет операция деления, так 
как в основе любого алгоритма вычисления СКС лежит представление исходного 
сообщения в виде огромного двоичного числа, делении его на другое двоичное число 
и использовании остатка от этого деления в качестве значения СВС. Деление — 
самая сложная из спераций СКС-арифметики. Здесь необходимо ввести так назы- 
ваемое слабое понятие размерности: число Х больше или равно числу У, если оба 
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значения имеют одинаковую размерность и позиции их старших битов единичны, 
то есть соотношение остальных битов Хи Удля операции сравнения не имеет зна- 
чения. Рассмотрим примеры операции деления, причем для лучшего понимания 
сделаем это в двух вариантах: вначале вспомним, как выполняется обычное деле- 
ние (по правилам двоичной арифметики с циклическим переносом), а затем вы- 
полним собственно СВС-деление. 

Возьмем произвольную двоичную последовательность и разделим ее на неко- 
торое число по правилам двоичной арифметики с циклическим переносом 
(рис. 9.3). 

По правилам СКС-арифметики деление для приведенных выше исходных дан- 
ных даст следующий результат (рис. 9.4). 






1101 10110100 042. 
* 1001 1001 11100001 — частное 





0000 10100 
1011 


об остаток 


Рис. 9.3. Схема вычисления двоичного деления (с циклическим переносом) 
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Ор остаток, фактически СВС 


Рис. 9.4. Схема вычисления СЯС-деления 
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Как видите, результаты обычного и СВС-делений отличаются. Главное, чтобы 
вы подметили особенность выполнения СКС-деления. Особое внимание обратите 
на порядок формирования промежуточных результатов в процессе деления. Снос 
двоичных разрядов из делимого продолжается до тех пор, пока размерности про- 
межуточного битового значения и делителя не сравняются, а их старшие разряды 
не станут равными 1. После этого над двоичными разрядами выполняется побито- 
вое СВС-вычитание. Соотношение разрядов не важно, главное — это одинаковая 
размерность и единичные старшие биты. В этом случае считается, что уменыьшае- 
мое больше вычитаемого, что влечет за собой включение 1 в частное и выполнение 
операции СВС-вычитания. Это как раз и есть проявление слабого понятия раз- 
мерности. Корзина для мусора, показанная на рис. 9.4, означает тот факт, что ча- 
стное для процесса вычисления СВС-битовой последовательности не играет ни- 
какой роли. 

Реальные двоичные последовательности являются результатом сцепления по- 
рой огромного количества отдельных байтов (символов), образуя одно большое 
двоичное число, для представления которого нужно использовать двоичные поли- 
номы огромных степеней. При этом каждый бит в подобной последовательности 
произвольной длины представляется в виде коэффициента длинного полинома. 
Например, для представления 128-разрядного блока необходим полином, состоя- 
щий из 1024 слагаемых, а для 1024-битового блока требуется полином уже с 8192 сла- 
гаемыми. В терминах полиномиальной арифметики двоичное число, сформиро- 
ванное в результате подобной сцепки составляющих блока данных, называется 
полиномом данных (сообщения) и обозначается как О(х) [5, 44]. В алгоритме вы- 
числения СКС вводится еще несколько полиномов и соотношений между ними: 


порождающий полином С(х) — предварительно особым образом выбранный 
полином, на который делится исходный полином сообщения; 
полином-частное О(х) — полином, получившийся в качестве частного от деле- 
ния полиномов О(х)/С(х); 
полином-остаток В(х) — полином, получившийся в качестве остатка от деле- 
ния полиномов О(х)/С(х). 
Между перечисленными полиномами существуют следующие отношения: 
Ох) = 9(х)х С(а) + Е), 
0(х) = (Ра) - Во) /6(<) 
Эти соотношения приводят к следующим основополагающим для дальнейше- 
го рассмотрения тезисам: 
операция деления двух двоичных полиномов О(х)/С(х), где С(х) + 0, дает в ка- 
честве результата полином-частное О(х) и полином-остаток В(х), удовлетво- 
ряющие условию: О(х) = О(х) х С(х) + В(>); 
остаток от деления двух полиномов Е(х) является двоичным числом, которое 
после вычитания из О(х) дает в результате еще один полином, делящийся без 
остатка на С(х); частное О(х), которое образуется в результате этого деления, 
отбрасывается за ненадобностью, а полином-остаток А(х) называют СКС ( СусЁс 
Кедип4апсу Со4Е). 
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Из приведенного выше описания общей схемы вычисления СВС возникает ряд 
вопросов: что представляет собой этот магический делитель С(х), каков его раз- 
мер? Выбор порождающего полинома С(х) — достаточно сложная задача. Пере- 
числим некоторые важные свойства, которые должны учитываться при выборе. 


Число разрядов (количество членов) в полиноме-остатке А(х) непосредствен- 
но определяется длиной самого порождающего полинома С(х). Выбор С(х) 
длиной и гарантирует, что полином-остаток от деления К(х) будет иметь раз- 
рядность не более, чем 7 - 1. Это следует из общего свойства операции деле- 
ния, которое предполагает, что остаток от деления должен быть меньше дели- 
теля. 


* Порождающий полином С(х) должен быть полиномиально простым. Это озна- 
чает его неделимость нацело на полиномы со значением в диапазоне от 2 до 
самого себя. 


» Способность порождающего полинома С(х) к выявлению ошибок, специфич- 
ных для передачи данных по каналами связи. Это такие ошибки, как ошибки 
в одном, двух битах, нечетном количестве битов, а также ошибки блока битов. 
Выше было отмечено, что более простые методы обнаружения ошибок переда- 
чи не способны обнаружить с достаточной степенью вероятности большинство 
таких типов ошибок. 


Для большей части алгоритмов вычисления СВС значение порождающего по- 
линома известно заранее и, сверх того, утверждено соответствующими стандарта- 
ми. Поэтому программисту без особой надобности не стоит терять времени и силы 
на изобретение нового значения порождающего полинома С(х). Приведем значе- 
ния некоторых широко известных полиномов, используемых на практике [44]. 


жб+ + д + хо — полином 10218, встроенный в протокол ХМОШЕМ и произ- 
водных от него протоколах передачи данных. Он стандартизован в специфика- 
ции \.41 МККТТ «Кодонезависимая система контроля ошибок». 


в 6+ 15+ 12 + л2 — полином 80051, используемый в протоколе двоичной синх- 
ронной передачи фирмы 1ВМ. Он также стандартизован в приложении «Про- 
цедура коррекции ошибок для оконечного оборудования линии с использова- 
нием асинхронно-синхронного преобразования» к стандарту у.42 МККТТ. Этот 
же полином широко известен как полином, реализуемый в алгоритме вычисле- 
ния СКС — СКС16. 

О ++ И + очи +20 — полиномМ 
04с119Б7Н, используемый в алгоритме вычисления СКС — СКСЗ2 и также спе- 
цифицированный в стандарте у.42 МККТТ. Этот полином, в частности, нахо- 
дит применение в технологии локальных вычислительных сетей Еегпее. Не- 
обходимо отметить, что вычисление по алгоритму СВСЗ?2 зачастую проводят и 
с другим полиномом: 0едЬ88320Н: х32 + х8! + 30 + + + А+ ++ 
+420 + 9 + 15 + 49 + 48+ лэ. К последнему полиному прибегают различные ар- 
хиваторы. Необходимо заметить, что полином 0е86883204 — это просто зеркаль- 
ное отражение полинома 04с11657Н. 
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В заключение привлеку внимание читателя к тому, почему выгодно увеличи- 
вать число разрядов СКС. Выше уже говорилось, что алгоритм вычисления СВС, 
по сути своей, является одним из возможных (и неплохих) алгоритмов хэширова- 
ния. Разрядность порождающего полинома С(х) 16 битов обеспечивает до 65 535 
значений хэш-функции. Увеличение разрядности полинома С(х) до 32 битов при- 
водит к расширению набора значений хэш-функции уже до 4 294 967 295. 

С полиномом связано еще одно понятие — степени полинома, которое но опре- 
делению является номером позиции его старшего единичного бита (считая с нуля). 
Например, для полинома 1011 из приведенного выше примера (см. рис. 9.4) сте- 
пень равна 3. 

В качестве выводов следует сказать, что СКС-арифметика отличается от дво- 
ичной отсутствием переносов/заемов, а СВС-вычитание и сложение выполняют- 
ся по тем же правилам, как и команда ассемблера ХОК, что и обусловливает ее важ- 
ную роль при вычислении значений СКС. 


Прямой алгоритм вычисления СВС 


После всех этих рассуждений мы готовы к тому, чтобы осмысленно воспринять 
общую схему реального алгоритма расчета СКС — алгоритма прямого (поразряд- 
ного) вычисления СКС. При этом удобно СКС-алгоритм рассматривать с точки 
зрения двух сторон-участников процесса: источника — объекта, формирующего 
сообщение для передачи, и приемника — объекта, который принимает сообщение 
и проверяет его целостность. 
Действия источника следующие. 
1. Выбрать полином Р, в результате автоматически становится известной его сте- 
пень М, 
2. Добавить к исходной двоичной последовательности М нулевых битов. Это до- 
бавление делается для гарантированной обработки всех битов исходной после- 
довательности. 


3. Выполнить деление дополненной М нулями исходной строки 5 на полином Р 
по правилам СВС-арифметики. Запомнить остаток, который и будет являться 


СКС. 


4. Сформировать окончательное сообщение, которое будет состоять из двух час- 
тей: собственно сообщения и добавленного в его конец значения СКС. 


К примеру, вычисление по этому алгоритму СКС для исходной последователь- 
ности 1101001110010110100 (см. рис. 9.4) и сама окончательная последовательность 
на стороне источника должны выглядеть так, как показано на рис. 9.5. 

Из рисунка видно, что в начале вычисления исходная последовательность 
1101001110010110100 дополняется нулями в количестве, равном степени полино- 
ма (Р= 1011 — степень полинома М = 3): 1101001110010110100 + 000. При выпол- 
нении СВС-деления эти дополнительные биты гарантируют, что все биты исход- 
ной последовательности примут участие в процессе формирования значения СКС. 
Результирующая последовательность получается равной исходной последователь- 
ности, дополненной значением СКС: 1101001110010110100+011. Заметим, что длина 
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Окончательное сообщение для передачи приемнику: 


1101001110010110100[01 1] 


Исходная последовательность 4 
Вычисленный СВС 





Рис. 9.5. Схемв формирования выходного сообщения из исходного с использоввнивм 
СВС-алгоритма 


присоединяемого к исходной последовательности значения СКС должна быть рав- 
на степени полинома, даже если СКС, как в нашем случае, имеет ведущие нули. 
Это очень важный момент, понимание которого является ключом к проникнове- 
нию в суть процессов, происходящих на стороне приемника при получении и оп- 
ределении целостности исходного сообщения. 

Действия алгоритма для приемника просты — выполнить деление полученной 
последовательности на полином. При делении нет необходимости дополнять исход- 
ную последовательность нулями, тем более что на практике соблюдение этого усло- 
вия крайне неудобно. Приемник попросту осуществляет СВС-деление получен- 
ной исходной строки (дополненной в конце исходным значением СКС) на полином 
ианализирует остаток. Если остаток от этого деления нулевой, то исходная после- 
довательность не была повреждена во время передачи. В противном случае суще- 
ствует очень большая вероятность нарушения целостности исходной последова- 
тельности, и нужно принимать дополнительные меры по выяснению и исправлению 
ситуации. Одной из таких мер может быть попытка восстаповления нужного зна- 
чения СКС. 
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Описанный выше алгоритм вычисления значения СВС называется прямым 
и чаще всего реализуется аппаратно. Но тем не менее, для совершенствования на- 
выков программирования на ассемблере составим реализующий его пример про- 
граммы. Хотя эффективность этой программы не слишком высока, у нее есть две 
учебные цели: 


= показать в виде программной реализации суть алгоритма вычисления СКС и са- 
мого СКС-деления; 


подготовить себя к пониманию более совершенных алгоритмов расчета СВС, 
к которым относится, в частности, рассматриваемый ниже табличный алгоритм. 


Для компьютерной реализации алгоритмов вычисления СВС удобно выбирать 
полиномы со степенями, кратными 8 (то есть размерности регистров) - 8, 16, 24, 
32 или даже 64. В этом случае можно подобрать команды из системы команд про- 
цессора, наиболее оптимально реализующие алгоритмы вычисления СКС. В каче- 
стве полинома выберем один из рекомендуемых полиномов (см. ниже) — 4003. 
И еще одно важное замечание — степень полинома определяет размерность регис- 
тра, используемого в алгоритме, при этом считается, что старший (всегда единич- 
ный) бит полинома находится сразу за левой границей регистра. В этих условиях 
программа реализации прямого алгоритма вычисления СЕС функционирует сле- 
дующим образом (для лучшего понимания в процессе разбора алгоритма см. 
рис. 9.6). В регистр побитово вдвигаются биты исходной строки. Это происходит 
до тех пор, пока при очередном сдвиге слева появится единичный бит. Тогда все 
содержимое регистра подвергается операции ХОК со значением полинома без стар- 
шего бита. Далее процесс сдвига и анализа выдвигаемого бита продолжается до 
того момента, пока не будет выдвинут очередной единичный бит, в результате чего 
опять между регистром и полиномом выполняется операция ХОК, и т. д. После того 
как последний бит вдвинут в регистр, в него вдвигается количество нулевых би- 
тов, равное степени полинома. Этим, как мы не раз уже отмечали, достигается уча- 
стие всех битов исходной битовой строки в формировании значения СКС. В итоге 
в регистре остается значение СКС, которое необходимо добавить к исходной стро- 
ке и передать приемнику. 


: Программа: рг909 01.азт. Демонстрация прямого алгоритма вычисления СКС 
(сторона-источник). 


ее ------ + 
. Чата 
БЕ_$Егтпд [1 “6476с8" ; исходная битовая последовательность 
: в символах 


Теп_Б1_$Ег1пд = $ - БЕ $19 
адг БЕ $г9то 94 Е $г1п9 
ро1Тпот [ем 4003и 
.соде 


195 $1. адг БТ $г1пд 
поу сх, 1еп Бе $ г 
ОУ Ьх. ро11пот 
51 ебх, 16 : подготовим ро]лпот к ХОВ с ЕАХ 
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ЮУ сх. 8 
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Врезультате вычисления СВС символьной последовательности "6476с8" иолу- 
чим СВС = З54аВ. 
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Рис. 9.6. Схема вычисления значения САС прямым алгоритмом 


Для того чтобы смоделировать действия стороны приемника, подходит та же 
самая программа со слегка измененными исходными данными — к строке Б\_5 пд 
добавляем вычисленное значение СКС. После этого под отладчиком наблюдаем 
за процессом СЕВС-деления, причем контролируем получаемый остаток. В опреде- 
ленный момент увидим, что он стал нулевым — это свидетельствует о том, что ис- 
ходная последовательность не была изменена. Для эксперимента можно изменить 
значения одного или более битов исходной последовательности и посмотреть, что 


получится. 


т Программа: рг909_02.ат. Демонстрация прямого алгоритма вычисления СЕС 


Е $Е год 


адг_Бл_5г1пд 
ро] 1пот 

.соде 

пали: 


ех1{: 


{сторона-приемник). 


[6%] "6476с8" : исходная битовая последовательность 
: в символах 

Теп_Б1%_$Ег1пд = $ - БЕ $Егт9 

[16 БЕ 56г1п9 

[в 4003И 


: см. предыдущую программу 
; выход из программы 
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Табличные алгоритмы вычисления САС 


Очевидный недостаток прямого метода — большое количество операций сдвига, 
исключающих операций «ИЛИ» (ХОВ) и операций условного перехода, которые 
выполняются для каждого бита исходного сообщения. Поэтому на практике ис- 
пользуется другой способ расчета СКС, называемый табличным. 


Основы 


Для того чтобы лучше понять суть табличного алгоритма вычисления СКС, обра- 
тимся опять к прямому методу, точнее к той схеме его вычисления (см. рис. 9.6), 
которая была реализована в приведенной выше программе. 

Из нее видно, что для текущего содержимого старшей половины регистра ЕАХ 
можно прогнозировать, как будет изменяться содержимое его битов по мере их 
сдвига. Для этого достаточно подвергнуть анализу биты ЕАХ начиная с самого стар- 
шего. Пронумеруем старшие 8 битов ЕАХ как а, а, а, аа, а» а, ау. При следую- 
щем сдвиге (см. рис. 9.6) прямой алгоритм определяет, будет ли произведена опе- 
рация ХОВ операнда с полиномом 6, 6,6. 6,6. 6,6, 6 вВХ (а, = 1) или нет (а, = 0). 
Если выдвинутый бит был равен 1, то прежнее содержимое старшей половины ре- 
гистра ЕАХ будет подвергнуто операции ХОК с соответствующими битами полино- 
ма. В противном случае, если выдвинутый бит был равен 0, значения битов будут 
не изменены, а просто сдвинуты влево на одни разряд. В принципе, имея большое 
желание, можно рассчитать заранее, каким будет содержимое А-го бита в #-й ите- 
рации сдвига. К примеру, значение нового старшего бита, определяющего действия 
алгоритма в следующей итерации, можно рассчитать по содержимому двух стар- 
ших битов старшего байта исходного операнда — а, ХОК а, АМО 6, где 6, — старший 
бит полинома (всегда равный единице). 

Теперь остановимся для того, чтобы рассмотреть и обсудить очередную схему 
(рис. 9.7). 


3 24 23 16 15 0 


1 
10010010 ‘хххххххх: == |еах (А) 
Хог : 


| 


[Результат Г м (Е) 


Рис. 9.7. Влияние на регистр ЕАХ серии операций ХОН при вычислении САС 





Из рассуждений выше следует, что если взять для рассмотрения старший байт 
операнда, то по его содержимому можно однозначно предположить, сколько опе- 
раций ХОВ и когда будет выполнено (см. рисунок). Обозначим старшую половину 
регистра ЕАХ как переменную А, а операнды со значениями полинома, объединяе- 
мые с А при единичном состоянии очередного выдвигаемого слева бита, обозна- 
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чим соответственно как В, С, Р (помним, что В = С = Л). Тогда формирование ре- 
зультата Е можно представить формулой: 
Е=((А |сдвиги| ХОВ В) |сдвиги] ХОК С) |сдвиги| ХОК В 

Здесь |сдвиги| представляют собой значение от 0 до 7 и определяются текущим 
содержимым старшего байта операнда (регистра ЕАХ). Благодаря ассоциативному 
свойству операции ХОК тот же самый результат можно получить, если предвари- 
тельно выполнить операцию ХОК над полиномами В, С, О с соответствующими зна- 
чениями сдвигов, а затем результат объединить по ХОВ с А: 


Е:=|сдвиги| ХОК (В [сдвиги] ХОВ С |сдвиги| ХОК 0) 
Е:= А ХОВЕ 


Отсюда следуют важные выводы: 


# величина Ё является совершенно точно предсказуемой по содержимому стар- 
шего байта операнда; 
если величина Ропределяется содержимым старшего байта операнда и собствен- 
но значением полинома, то существует всего 256 возможных значений этой ве- 
личины (по количеству значений, представимых беззнаковым байтом); 


исходя из нервых двух положений, величина ЁЕне зависит от значения операнда 

и может быть рассчитана заранее, при этом результаты ее расчетов поддаются 

сведению в таблицу (!). 

Вот мы и выяснили, на чем основано название табличного алгоритма расче- 
та СКС. Теперь со знанием сути дела приведем его общее описание (рис. 9.8). В ка- 
честве основы для рассуждений по-прежнему используем программу прямого вы- 
числения значения СКС и соответствующую схему (см. рис. 9.6). 






70 Регистр ЕАХ 


(2) Очередной байт исходной 
последовательности 


Таблица с заранее 
вычисленными значениями Е 


15 7 0 
Рис. 9.8. Общая схема табличного алгоритма 


На схеме, показанной на рисунке, цифрами обозначена последовательность 
шагов табличного алгоритма. Шаги 1 и 2 выполняются одновременно и означают, 
что старший байт из регистра ЕАХ выдвигается в переменную К, а младший байт 
этого регистра заполняется очередным байтом исходной последовательности. Зна- 
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чение переменной А используется на шаге 3 в качестве индекса в таблице ТАВЕ_Ё 
для извлечения 16-битового значения, которое на шаге 4 будет объединено онера- 
цией ХОК с содержимым старших 16 битов регистра ЕАХ. Таким образом, в отличие 
от прямого алгоритма, процесс преобразования вырастает до уровня байтов и со- 
держит три операции: сдвига, доступа к таблице для извлечения нужного значе- 
ния и операции ХОК извлеченного значения с содержимым старшей половины ЕАХ, 
По окончании процесса в старшей половине ЕАХ будет находиться значение СВС. 
Сообщение по-прежнему должно быть выровненным, то есть дополненным коли- 
чеством битов, равным степени полинома, или для данного случая — 16. Для прак- 
тических приложений это крайне неудобно, и решение проблемы будет показано 
чуть ниже. Пока же разработаем программу вычисления содержимого таблицы на 
основе полинома 10211 степени 16. 


Программа: рг909_03.азт. Вычисление содержимого таблицы 
на основе полинома 10211 степени 16. 


таб1_16 0 256 аир (0) : СВС-таблица 
1еп_ФаБ1_16 = $ - фаБ1_16 
адг (аБ1`16 [6 фаБ1_16 
ро1Тпот [6 10218 
.соде 


1е5 41. адг Ча _16 
а0д 91, 1еп {аб —16 - -2 


$9 : идем назад по таблице 
оу сх. 255 
оу Ьх. ро]1пот 
т: хог ах, ах 
оу ап. с1 : индекс в таблице для вычисления СКС 
ризИ сх : вложенные циклы 
оу сх. 8 
12: $11 ах. 1 
ис Ще) : старшие разряды не равны — выполняем 


; сдвиг (частное нас не интересует) 
------ старшие разряды равны — выполняем ХОК 


хог ах. Бх ; ах ХОК ро11пот 
п3: Тоор 2 

рор сх 

$60$м 

Тоор ЩИ 


В результате работы этой программы область памяти фаЫ__16 будет инициали- 
зирована таблицей значений, которые могут быть задействованы в схеме вычисле- 
ния значения СКС исходной последовательности (см. рис. 9.8). 


Прямой табличный алгоритм СВС16 


Необходимость дополнения исходной строки завершающими нулевыми байтами 
представляет большое неудобство при реализации общей схемы табличного 
алгоритма. Поэтому на практике выбирают другую схему вычисления СВС, нетре- 
бующую завершения исходного сообщения нулевыми байтами. В этой схеме оче- 
редной байт исходной строки объединяется операцией ХОК со старшим байтом ре- 
гистра, выдвинутым с левой стороны этого регистра. Полученное в результате 
объединения значение используется в качестве индекса для доступа к СВС-табли- 
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це. Извлекаемое из СВС-таблицы значение объединяется операцией ХОК с содер- 
жимым регистра. Описанный алгоритм называют прямым табличным алгоритмом. 
Ниже приведены его схема (рис. 9.9) и демонстрационная программа. 


--. [ айты исходной строки без завершающих нулевых байтов 





Рис. 9.9. Схема вычислений СВС с использованием прямого табличного алгоритма 


На схеме вычислений СКС с использованием прямого табличного алгоритма 
цифрами обозначена последовательность шагов вычисления СВС. 


1. Выдвижение старшего байта регистра АХ в байтовую ячейку. 


2. Выполнение операции ХОК над выдвинутым на шаге 1 в байтовую ячейку стар- 
шим байтом регистра АХ и очередным байтом исходной строки. 


3. Полученное на шаге 2 значение используется в качестве индекса для доступа 
к элементу СВС-таблицы. 

4. Извлеченное из СКС-таблицы значение объединяется по ХОВ со значением в ре- 
гистре АХ. 

5. Результат выполнения на шаге 4 операции ХОК помещается обратно в регистр АХ. 


После обработки последнего байта исходной строки регистр АХ содержит зна- 
чение СКС. Программа вычисления СВС посредством прямого табличного алго- 
Вт приведена ниже. 


Программа: рг909_04.азт. Вычисление СКС с использованием 
прямого табличного алгоритма. 


сы 
ЫЕ $г1пд [61° "6476с8” ; исходная битовая последовательность 
: в символах 
Теп_61е_$Ёг1п9д = $ - БЕ $г119 
адг Б1е $6г1по 09 Б1Е $г1по 
саБт_16 Чи 256 аир (0) ; СВС-таблица 
1Леп_таь]_16 = $ - таб1_16 
адг_баЬ1_16 09 фаь1_16 
ро1зпот [6 1021И 
.соде 


уче --- расчитываем СВС-таблицу 
Те5 01. адг та _16 
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1: 


2: 


а09 — 91. Теп_фаБ1_16 - 2 

$9 ; идем назад по таблице 
том сх. 255 

ОУ Ьх. ропот 

хог ах. ах 


ОУ ан. с1 : индекс в таблице для вычисления СКС 
------- вложенные циклы 

рибй сх 

| сх. 8 

$11 ах. 1 

пс п3 ; старшие разряды не равны — выполняем 


: сдвиг (частное нас не интересует) 
+------ старшие разряды равны — выполняем ХОК 


хог ах. Бх ; ах ХОВ ро1 пот 
100р п? 
рор сх 
$05 
Тоор м1 
:------ закончили расчет СКС-таблицы 
хог ах. ах 
хог Ьх. Бх 
14$ $1. адг 61$ г1п9 
[е. сх. 1еп БЕ $&г1пд 
ОУ Ы. ав 
$Н1 ах. 8 
хог Ы, 151] 
$1 Бх, 1 
хог ах. таб? _16[Ьх} 
хог Би. БИ 
тис 51 


100р м 


Рассмотрением этого алгоритма введение в проблему вычисления СКС можно 


было бы и закончить. Все существующие модели вычисления СВС являются, по 
сути, различными модификациями описанного выше табличного алгоритма. Эти 
модификации преследуют разные цели, перечислим некоторые из них: 


` 


переход от цикла по всем битам к циклу по большим порциям данных — бай- 
там, словам и т. д.; 

повышение разрядности порождающего полинома; 

отражение особенностей функционирования аппаратуры передачи данных (на- 
личие этой цели обусловлено тем, что микросхемы, поддерживающие работу 
последовательного порта компьютера, передачу байта начинают сего младших 
битов, поэтому описанные ниже алгоритмы расчета СКС, учитывающие эту 
особенность, называются зеркальными). 


Алгоритмы вычисления СКС получили свое закрепление в некоторых стандар- 


тах. Перечислим отличительные особенности основных алгоритмов расчета СКС. 
Итак, основные алгоритмы вычисления СКС различаются: 


по значению и степени порождающего полинома, при этом значение полинома 
обычно указывается без ведущей единицы в старшем разряде; 

по начальному содержимому регистра, в котором формируется значение СВС; 
по тому, производится ли перестановка в обратном порядке битов каждого бай- 
та перед его обработкой; 

по способу прохода байтов через регистр — снособ может быть косвенным или 
прямым; 
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по тому, осуществляется ли перестановка в обратном порядке конечного ре- 
зультата; 


по конечному значению, с которым производится объединение по ХОК резуль- 
тата вычисления СКС. 


После появления 32-разрядных процессоров наибольшей популярностью ста- 
ли пользоваться 32-разрядные алгоритмы вычисления СКС. В различных источ- 
никах рассматривают два типа таких алгоритмов — прямой и зеркальный. Рассмот- 
рим их конкретные реализации, рекомендуемые стандартами. 


Прямой табличный алгоритм СВСЗ2 


Как и любой табличный алгоритм, табличный алгоритм вычисления СВСЗ2 тре- 
бует задания СВС-таблицы..Ее можно задать в программе статически, явно про- 
писав значения элементов таблицы в сегменте кода, или динамически, вычислив 
значения элементов таблицы перед началом расчета СКС. Ниже приведена про- 
Е вычисления СВС-таблицы для полинома 041147. 


Е СКСЗ2-таблица для прямого табличного алгоритма 
вычисления СЕСЗ2 
Та6)_32_ @1гесё 94 256 дир (0) 
1еп_фаБ1_32 длгесЕ = $ - таБ_32_@1гесь 
ааг_таб1_32_Фгесё 949  ТаБТ_32_д\гесе 
ро11пот 04 ОАстТаь7н 
.собе 


1ез. 01, адг_ФаБ1Т_32_д1гесе 
а04 41. 1еп фаБТ_32_очгесе - 4 


54 ; идем назад по таблице 
оу сх. 255 
оу ебх. ро11пот 

т: хог еах. еах 


УНга еах. есх. 8 
1------ вложенные циклы 


ризп сх 
пом сх. 8 
2: $1] еах. 1 
пс 73 : старшие разряды не равны — выполняем 


: сдвиг (частное нас не интересует) 
------ старшие разряды равны — выполняем ХОВ 


хог еах. ебх ; ах ХОВ ро11пот 
м3: ]Лоор 2 

рор сх 

$0$4 

т п] 


Прямой она алгоритм СКСЗ2 удобно рассматривать со стороны участ- 
ников процесса, как это мы делали выше. Источник выполняет следующие дей- 
ствия. 

1. Делает начальную установку регистра, в котором будет производиться форми- 
рование СКС, значением ОРЕЕЕЕЕЕЕБ. 

2. Вычисляет значение СКС для каждого байта исходной последовательности, 
принцил которой показан на схеме (см. рис. 9.9). Читатель понимает, что хотя 
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эта схема иллюстрирует принцип вычисления СВС16, но для 32-разрядного 
алгоритма нужно только увеличить размер элементов таблицы до 32 битов и за- 
действовать весь регистр ЕАХ. 
3. Объединяет по ХОВ итоговое значение в ЕАХ со значением ОРЕЕЕЕЕЕЕЙ. 
4. Добавляет вычисленное значение в конец двоичной исходной последователь- 
ности. После этого его можно передать по назначению. 
Ниже приведена программа вычисления СВСЗ2 по прямому табличному алго- 
р: 


БЕ $1г1пд [613] "}23456789" ; исходная битовая последовательность 
; в символах 
Теп_Бл_56г1пд = $ - 51 $6г1и9 
СГСЕЗ2 94 0 ; сюда поместим значение СКСЗ2 
адг БЕ 56г1то 64 Е $г тд 
Фаьт_ 32 1гесЕ @4 256 дир (0) : (ВСЗ2-таблица для прямого табличного 


; алгоритма вычисления СКСЗ2 
Теп_ФаБ1_32_@1гесе = $ - фаб1_32_@1гесе 
афг таБ1_32_@1гесё Ча саБТ_32_@1гесе 
ро17пот [14 04с11457В 
.соде 


1------ рассчитываем СВСЗ2-таблицу 
1е5 Чт. адг таб _32_д1гест 
ада 41. Теп_баБТ_32_@1гес®-4 


56а ; идем назад по таблице 
ЮУ сх. 255 
ПУ ех. ро11пот 

п: хог еах. еах 


эпга еах. есх. 8 
;------ вложенные циклы 


рый сх 
Ще сх. 8 
м2: 551 еах. 1 
Зис 3 : старшие разряды не равны — выполняем 


; сдвиг (частное нас не интересует) 
рЕнее= старшие разряды равны — выполняем ХОВ 


хог еах. ебх ; ах ХОВ ро11пот 
м3: Тоор 2 

рор сх 

56054 

Тоор м 


ивы закончили расчет СВСЗ2-таблицы 
Ще еах. ОРЕЕЕЕЕЕТИ 
195 $1. адг Бе $г1тд 


поу сх. 1еп Е $ёгиа 
пы: хог ебх. ебх 

$714 ебх. еах. 8 

$1 еах. 8 


хог Ы. [$1] 
хог еах. фаБ1_32_а1гес[Ьх] 
тис $1 
10о0р м 
------ запишем сгс-32 в конец последовательности 
я (или начало. см. обсуждение ниже) 
хог еах. ОРЕЕРЕРЕЕ 
оу сгс 32. еах : добавляем в конец исходной 
: последовательности 
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Значение СКВС32 для строки "123456789" равно 9с970409В. 

Если для источника стандарт определяет практически однозначную последо- 
вательность действий, то для приемника возможны несколько вариантов поведе- 
ния. Отметим два из них. 

В первом варианте критерием для вывода о целостности полученного прием- 
ником сообщения является результат сравнения или нулевой результат. 


1. Выполнить начальную установку регистра, в котором будет производиться 
формирование значения СКС. 


2. Вычислить значение СКС для каждого байта полученной последовательности, 
принцип которой показан на схеме (см. рис. 9.9 и замечания выше о различиях 
СКС16 и СВСЗ2). 


3. Объединить по ХОВ итоговое значение в ЕАХ со значением ОЕЕЕЕЕЕЕЕВ. 
4. Далее можно сделать одно из двух действий: 


С сравнить значение в ЕАХ со значением СВС, полученным вместе с сообще- 
нием, — если они равны, то поступившее сообщение идентично исходному; 


С пропустить байты со значением СВС через процесс получения СВС нарав- 
не сдругими байтами — об успехе будет свидетельствовать нулевая величи- 
на (этот вариант предпочтительнее, так как не предполагает получение пред- 
варительных сведений о длине начальной последовательности без учета 
исходного значения СКС). 


Во втором варианте критерием для вывода о целостности полученного прием- 
ником сообщения является фиксированная двоичная константа 66202са2К. 


1. Выполнить начальную установку регистра, в котором будет производиться 
формирование СКС, в значение ОРЕЕЕЕЕЕЕВ; 


2. Вычислить значение СВСЗ2 для каждого байта полученной последовательно- 
сти (вместе со значением СКСЗ2 в конце), принцип которой показан на схеме 
(см. рис. 9.9 и замечания выше о различиях СКС16 и СКСЗ?2). Должно полу- 
читься фиксированное двоичное значение — 66202са2В. Необходимо заметить, 
что влитературе можно встретить другое число — ОдеЬ20езКВ, но уавтора полу- 
чалось первое. 


Основное отличие этих двух вариантов в том, что нужно каким-то образом от- 
делять контролируемую строку и ее значение СВСЗ2. Избежать прямого отслежи- 
вания длины принимаемой строки на стороне приемника можно путем формиро- 
вания источником значения СВСЗ2 в начале исходной строки либо вообще вне 
строки. Последний случай, например, характерен для программы, которая отсле- 
живает целостность файлов в некотором каталоге. Тогда результаты подсчета СК.С 
для каждого файла хранятся в некотором служебном файле. Если такой вариант 
вас не устраивает, следует написать код приемника для прямого табличного алго- 
ритма так, как это сделано для приемника в зеркальном табличном алгоритме. 
Попробуйте самостоятельно определить константу, соответствующую успешному 
принятию приемником исходной строки. | 

Учитывая практическую важность обоих вариантов и для демонстрации раз- 
нообразия подходов к проблеме вычисления СВСЗД, работу приемника для пря- 
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мого табличного алгоритма продемонстрируем на примере первого варианта, при- 
емник «зеркального» табличного алгоритма СВСЗ2 разработаем исходя из поло- 
жений второго варианта. Новы должны понимать, что правильное понимание прин- 
ципов расчета СКС позволяет вам при соответствующей доработке кода поменять 
варианты работы приемников. В поле сгс_32 должно быть значение СВСЗ2, рас- 
считанное предыдущей программой. Автор специально не стал объединять эти 
о Пусть это сделает читатель в нужном для его текущей работы контексте, 


. Программа: рг909_07.азт. Демонстрация действий приемника | 
: табличного алгоритма СВСЗ2 при анализе поступившего сообщения. | 


4 + 

«бака 

БЕ $Ег1тд [‹) "323456789" : исходная битовая последовательность 
; в символах 

Теп_Б1е_5%г1пд = $ - БЕ $19 

сгс_32 98 —9с970409й : значение СВСЗё. рассчитанное источником 
: Аля данной исходной последовательности 

абг БЛ $гта 4 ЫЕ $г1т9 

саБТ_ 32 Ч1гесЕ ва 256 дир (0) ; СВСЗ2-таблица для прямого табличного 


; алгоритма вычисления СВСЗ2 
Теп_баБ1_32_а1гесь = $ - баБ1_32_91гес* 
адг_фаБ1_32_д1гесе да хаБ1_32 Ч1гесе 
ропот [е4 04с11457н 
.соде 


1------ рассчитываем СВСЗ2-таблицу 
1Те5 91. ааг ваБ1_32_91гес& 
ада 41. 1еп каб 32_ФАгесь - 4 


56а ; идем назад по таблице 
том сх. 255 
ЮУ ебх. ро11пот 
п}: хог еах. еах 
ига еах. есх. 8 
риП сх ; вложенные циклы 
[ет сх. 8 
2: $11 еах. 1 
Зис 3 ; старшие разряды не равны — выполняем 


; сдвиг (частное нас не интересует) 
Е старшие разряды равны — выполняем ХОВ 


хог еах. еБх : ах ХОК ро11пот 
п3: Тор 2 

рор сх 

$6054 

Тоор т 


1------ закончили расчет СВС32-таблицы 
ЮУ еах, ОРРЕЕРЕЕ 
145 51. адг БЛ 519 


[Ще сх. Теп_ ВА ${г1пд 
пы: хог ебх. еБх 

$14 ебх. еах. 8 

51 еах. 8 


хог Ы. [$1] 
хог еах. фаБ1_32_огес[Ьх] 
пс $1 
Тоор п 
хог еах. ОРЕЕЕЕЕЕЕ 
;------ если исходная последовательность цела, то должно получиться 
: значение сгс32=9с9704091 его можно сравнить с исходным 
и на этом закончить работу или продолжить до победного. 
то есть до 0 
[7 сх. 4 ; 4 (длина сгс_32). в $1 адрес сгс 32 
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ЮУ ебх. сгс_32 

Ь5мар ебх 

ОУ сгс_32. еБх 
05: хог ебх. ебх 

$114 еБх, еах. 8 

$11 еах. 8 


хог Ы. [$11 

хог еах. ФаБ1_32_@1гес [Ьх) 
17 $1 
100р 15 
а : должен быть 0 

Заметьте, что для получения нулевого результата нам пришлось использовать 


команду ВЗ\МАР, чтобы «перевернуть» значение в поле сгс_32. 


«Зеркальный» табличный алгоритм СВСЗ2 


В заключение данного раздела обсудим «зеркальный» вариант табличного алго- 
ритма — алгоритм СВСЗ2 (у.42 МККТТ). Этот вариант вычисления СКС обязан 
своим возникновением существованию последовательного интерфейса, который 
посылает биты, начиная с наименее значимого (бит 0) и заканчивая самым стар- 
шим (бит 7), то есть в обратном порядке. В «зеркальном» регистре все биты 
отражены относительно центра. Например, 10111011001 есть отражение зна- 
чения 10011011101. 

Вместо того чтобы менять местами биты перед их обработкой, можно зеркаль- 
но отразить все значения и действия, участвующие в прямом алгоритме. При этом 
направление расчетов поменяется — байты теперь будут сдвигаться вправо, поли- 
ном 04с1147В зеркально отразится относительно его центра, в результате полу- 
чится значение 0е4Ь883201. СКСЗ2-таблица будет зеркальным отражением анало- 
гичной таблицы для прямого алгоритма (рис. 9.10). 

Для зеркального алгоритма вычисления СВСЗ2 процесс вычисления такой же, 
за исключением порядка — сдвиги и заполнение регистра осуществляются впра- 
во. Ниже приведена программа вычисления таблицы для зеркального алгоритма 
СКСЗ2 и полинома 0Е0888320Н. 


бе завершающих нулевых бйт = 





Рис. 9.10. Схема зеркального табличного алгоритма 
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: Программа: рг909_08.а5т. Вычисление таблицы для зеркального ] 
алгоритма СВСЗ2 и полинома 0Е0888320Н. ] 


ты 
ФаБ1_32 ппггог 98 256 дир (0) : СКСЗё-таблица для зеркального 
; табличного алгоритма расчета СВС32 
Теп_ФаБ1_32_пуггог = $ - ва_32_пггог 
адг_фаБЛ_32 пиггог 94 +аБЛ_32 туггог 
ро17пот 08 0Е0888320/ 
.соде 


1е5 — 1. абг та 32 пиггог 
ада 41. 1еп са _32_паггог - 4 


514 : идем назад по таблице 
МОУ сх. 255 
ПУ ебх. ро?1пот 
м1: хог еах. еах 
МОУ 81. с1 : индекс в таблице для вычисления СВС 
ризп сх ; вложенные циклы 
МОм сх. 8 
2: $ИГ еах. 1 
зпс 3 : старшие разряды не равны — выполняем 


: сдвиг (частное нас не интересует) 
НЕЕ НАХ, старшие разряды равны — выполняем ХОК 


хог еах. еБх ; ах ХО ро11пот 
03: Тор [7 

рор сх 

$4054 


100ор м1 


Для того, кто обладает солидным багажом знаний по проблеме СВС-вычисле- 
ний, написание программы, реализующей зеркальный алгоритм, — дело техники. 
На стороне источника код будет выглядеть так: 


еее неее - + 
Программа: рг909 09.а5т. Вычисление кода (КСЗ2 на стороне источника 
: для зеркального алгоритма СКСЗ2 и полинома 0Е0В883201. 
еее - + 
„Чака 
Блт_$1г1пд [6] 5) “123456789” : исходная битовая последовательность 
; в символах 
Теп_Б1_5ёг1та = $ - БЕ $19 
сгс_32 94 70 : сюда поместим значение СВСЗ2 
адг БЕ 5Еглпа 94 ЫЕ $+г1п9 
ФаБТ_32`пуггог 94 256 дир (0) : СКСЗ2-таблица для зеркального 


; табличного алгоритма вычисления СВСЗ2 
]еп_ фа _32_пуггог = $ - фа61_32_паггог 
адг_фаБЛ_32 пиггог Ча саБТ` 32 паггог 
ропот 94 0Е08883208 
.соде 


++ --- рассчитываем зеркальную СКСЗ2-таблицу 
1е$ 41. адг фа _32_птггог 
ада 61. еп ваБ1`_32_пиггог - 4 


51а ; идем назад по таблице 
ОУ сх. 255 
МОУ еБх. ро11пот 
т}: хог еах. еах 
оу а1. с1 ‚индекс в таблице для вычисления СКС 
:------ вложенные циклы 
ризИ сх 


ту сх. 8 
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2: $Вг еах, 1 
эйс 3 : старшие разряды не равны — выполняем 
; сдвиг (частное нас не интересует) 
ране старшие разряды равны — выполняем ХОВ 


хог еах. еБх ; ах ХОВ ропот 
пЗ: Тоор 2 

рор сх 

56054 

Тоор м 

+= закончили расчет СВСЗ2-таблицы 

хог х. Бх 

МОУ нь ОЕРЕРРЕРЕИ 

19$ ‚ адг БЕ $г1пд 

Мом ы, 1еп 1 56г1по 
па: Шей Ы, а1 

$Иг еах, 8 

хог Ы. [51] 

хог еах. ТаБ1_32_пиггог(Ьх] 

1тс 51 


Тоор м 
хог еах. ОТЕРЕЕРЕ 
НЕВЕ запишем сгс-32 в конец последовательности 
тоу сгс_32. еах ; добавляем в конец исходной 
; последовательности 


Для исходной строки "123456789" вычислили СВС = 1Ъ948а57 В. Теперь оста- 
лось приемнику проверить целостность полученной им строки. Приемник работа- 
етпо второму варианту и выполняет действия, иллюстрируемые приведенной ниже 
программой. Если полученная им строка совпадает с исходной, то результатом 
ре программы должно быть значение 65202са2В. 


|| Программа: рг909_10.а5т. Вычисление кода СВСЗ2 на стороне приемника | 
для зеркального алгоритма СКСЗ2 и полинома 0Е08883201. | 


+ ан ----- + 
“дата 

:исходная битовая последовательность в символах 

ЫЕ гид [е°) "123456789" 

Теп_Б1_$фг1па = $ - БЕ ги 

сгс_32 94 —15948а578 ; сода ны поместили значение СКСЗ2 

адг БЕ 5г1ио а Е $Ег1и9 

ФаьТ_32`пиггог 64 256 ар (0) : СВСЗ2-таблица для зеркального 


:; табличного алгоритма рассчета СВСЗё 
Теп_фаБ1_32 пйггог = $ - саЛ_32_пуггог 
адг_каБ1_32 пиггог 4 +аб1_32 пиггог 


ро17пот 04 0Е0888320Н 
.сове 
----- рассчитываем зеркальную СВСЗ2-таблицу 
]е5 91, адг КаБТ_32_тэггог 
ада 91. 1еп фа _32_пггог - 4 
54 ; идем назад по таблице 
ПУ сх. 255 
оу ебх. ро11пот 
м1: хог еах. еах 
ЮУ а]. с] ; индекс в таблице для вычисления СКС 
1------ вложенные циклы 
ризИ сх 
ЮУ сх. 8 
м2: ИГ еах. 1 
Зис 3 : старшие разряды не равны — выполняем 


; сдвиг (частное нас не интересует) 
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+ -- старшие разряды равны — выполняем ХОВ 


хог еах. ебх :; ах ХОК ро11пот 
03: Тоор та 
рор сх 
$6054 
100р п : закончили расчет СВСЗ2-таблицы 
хог Ьх. Бх 


[Ще еах. ОРЕЕРЕРЕЕВ 
14$ $1. адг_Б1_$%г1п9 


то сх. 1еп 51 $&г1ид + 4: 4 - длина сгс_32 
м: ОУ Ы, а1 

ЗАИР еах. 8 

хог Ы. [51] 

хог еах. фа51_32 пиггог[Ьх] 

пс $1 

Тоор и 


еее сравнить — результат должен быть константой 65202сагн 


Этот вариант работы алгоритма вычисления СВСЗ2 удобен тем, что не нужно 
знать длину собственно исходной последовательности (без значения СКС). Дос- 
таточно просто обработать весь входной поток, не различая в строке завершаю- 
щую ее подстроку с СКС. Далее необходимо сравнить содержимое регистра ЕАХ 
с 66202сагн. Если эти значения равны, значит, исходная последовательность нару- 
шена не была. Для получения собственно строки достаточно отбросить последние 
4 байта сообщения, поступившего к приемнику. И последнее замечание, которое 
говорит о том, что проблема вычисления СКС неоднозначна для понимания и пре- 
доставляет большое поле для проведения различных экспериментов и совершен- 
ствования существующих алгоритмов. Небольшой поправкой в алгоритме работы 
источника можно сделать так, что успехом целостности при принятни приемни- 
ком сообщения может быть не указанная выше константа, а нуль. Для этого источ- 
нику достаточно не объединять вычисленное значение СВСЗ2 по ХОВ с ОНТ, 
а просто добавить его к исходной последовательности. Оба варианта хороши тем, 
что не нужно заранее знать длину анализируемого сообщения. 

Здесь, пожалуй, можно и закончить обсуждение проблемы вычисления СВС. 
На примере этой достаточно сложной задачи были в очередной раз продемонстри- 
рованы варианты использования средств ассемблера для обработки информации 
на различных уровнях, вплоть до битового. За дальнейшими подробностями по про- 
блематике вычисления СВС обратитесь к соответствующим источникам [5, 38, 44]. 








Глава 10 


Расширения традиционной 
архитектуры 1е! 


Писать музыку не так уж трудно, сложнее 
всего зачеркивать лишние ноты. 


Иоганн Брамс 


С появлением процессоров пятого поколения (Репйит, Репбит ММХ...) в про- 
граммной модели процессора [| следует различать два слоя архитектуры: базо- 
вый и модельно-зависимый. 

Слой базовой архитектуры включает в себя элементы архитектуры, поддерж- 
ку и неизменность которых производитель (Гпёе|) гарантирует. Это набор и струк- 
тура основных устройств процессора, системных регистров и регистров общего 
назначения, архитектура памяти ит. д. 

Модельно-зависимый слой архитектуры включает в себя средства, поддержка 
которых привязана к конкретной модели процессора (как правило, снизу вверх). 
Для того чтобы программа, исполняемая на конкретном процессоре, могла полу- 
чить сведения о его возможностях, в систему команд процессоров, поддерживаю- 
щих [АЗ2 (Пике, АМП ит. д.), включена команда (РИО. Данная команда позволяет 
программе в любой момент времени запросить сведения о классе, модели и архи- 
тектурных особенностях текущего процессора. Подробное описание данной коман- 
ды приведено в приложении А учебника, а пример ее использования вы найдете 
в материале данной главы. 

Ниже мы рассмотрим следующие расширения базовой архитектуры процессо- 
ра Гиёе!. 

целочисленное ММХ-расширение; 


ХММ-расширение — потоковое ММХ-расширение для работы с данными ве- 
щественного типа; 
поддержка модельно-зависимых особенностей процессоров [АЗ2. 


ММХ-технология процессоров фе! 


В 1997 году фирма Ги] представила свой новый процессор — Репиит® ММХ"\м. 
По сравнению с предыдущими моделями процессоров этой фирмы (1486 и Реп- 
Чит), в его архитектуру были добавлены новые наборы регистров и команд. 
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Репиит© ММХ"" стал своеобразной вехой в длинном ряду моделей процессоров 
семейства 180х86. С его появлением процессоры этого семейства естественно раз- 
биваются на три труппы, отражающие три этапа в истории развития процессоров. 


16-разрядные процессоры 18086 и 180286 заложили основу популярности про- 
нессоров фирмы Пи]. Их система команд содержала около 170 машинных ин- 
струкций, включая инструкции сопроцессора. 


Программная модель 32-разрядных процессоров 1386, 1486, Репиит, Репиит 
Рго практически одинакова и включает в себя порядка 220 команд. 


32-разрядные процессоры Репиит ММХ, Репиим П, Репйит Ш, Репиим 4 
поддерживают новые технологии обработки данных, которые обеспечиваются 
введением в их архитектуру дополнительных регистров и команд. Эти новые 
архитектурные элеменгы составляют так называемое ММХ-расширение. Сис- 
тема команд процессоров Репиип ММХ и Репиит П насчитывает около 300 ко- 
манд, а процессора Репиит Ш(4) — еще на 144 команды больше. 


В этой главе мы обсудим ММХ-расширение системы команд процессоров Реп- 
пит ММХ, Репииш Пи Репиит ПТ(4). 

ММХ-расширение процессора Репйит предназначено для поддержки прило- 
жений, ориентированных на работу с большими массивами данных целого и веше- 
ственного типов, над которыми выполняются одинаковые операции. С данными 
такого типа обычно работают мультимедийные, графические, коммуникационные 
программы. Именно по этой причине данное расширение архитектуры процессоров 
ие] и названо ММХ (Ми Мефа еепяюп$ — мультимедийные расширения). 

Ввиду появления процессора Репбит Ш следует различать ММХ-расширения 
двух типов — целочисленное и с плавающей запятой. Каждое из этих ММХ-рас- 
ширений имеет свою программную модель и не зависит от другого. Чтобы обосо- 
бить эти типы расширений, введем следующие условные обозначения: целочис- 
ленное ММХ-расширение будем называть ММХ-расширением, а ММХ-расширение 
с плавающей запятой — ХММ-расширением. 


ММХ-расширение архитектуры 
процессора РепНит 


Целочисленное ММХ-расширение архигектуры процессора РепНит представля- 
ет собой программно-анпаратное решение, дополняющее архитектуру данного про- 
цессора новыми свойствами. Впервые это расширение было введено в процессоре 
Репиии ММХ. В неизменном виде оно поддерживается в последующих версиях 
процессоров Репиит. В Репцит Ш целочисленное ММХ-расширение было до- 
полнено новыми командами. Знакомство с архитектурой целочисленного ММХ- 
расширения удобно вести в рамках модели, основу которой составляют два ком- 
понента — программный и аппаратный. 


Модель целочисленного ММХ-расширения 


Основа программного компонента — система команд ММХ-расширения (57 ко- 
манд) и четыре новых типа данных (рис. 10.1). ММХ-команды являются естествен- 
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ным дополнением основной системы команд процессора. Главным принципом их 
работы является одновременная обработка нескольких единиц однотипных дан- 
ных одной командой (пе пугисйоп МшШаре Оака, $1МО). 


Восемь упакованных байтов 
63 55 47 39 31 23 15 7 0 


Четыре упакованных слова 
63 47 31 15 0 


Восемь упакованных байт 
63 31 0 


ЕВЕ Е ЕЕ 


Учетверенное слово 
63 0 


ЕЕ А ее С 


Рис. 10.1. Типы данных, поддерживаемые командами ММХ-расширения 


Из рисунка видно, что размер поля, занимаемого данными любого из этих ти- 
пов, одинаков и составляет 64 бита. В них упаковываются и затем используются 
как отдельные объекты данные размером байт, слово и двойное слово (их мы бу- 
дем называть элементами операндов). Именно стакими объектами работают ММХ- 
команды. Такой подход приводит к существенному ускорению обработки данных, 
прежде всего, за счет экономии тактов процессора на передачу данных и выполне- 
ние самой команды. Кстати, здесь позитивно сказывается большая размерность 
шины данных процессора Репйит, которая равна 64 битам. 


79 63 0 





Т.к НИИ 
Е ВЕ их 


а ЗЕ ПО 
ее, И 
ПЕЕНИНСЙ ЗЧ 
ее, 2 И 
о ИИ о6 
о. ми 


Рис. 10.2. Отображение ММХ-регистров на регистры стека сопроцессора 
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Основа аппаратного компонента — восемь новых регистров. Слово «новые» не 
совсем корректно. На самом деле в ММХ-расширении используются регистры 
сопроцессора. Как известно, регистры сопроцессорного стека имеют размерность 
80 битов, что касается регистров ММХ-расширения, то их размерность — 64 бита. 
Поэтому, когда регистры сопроцессора играют роль ММХ-регистров, то доступ- 
ными являются лишь их младшие 64 бита. К тому же, при работе стека сопроцес- 
сора в режиме ММХ-расширения он рассматривается не как стек, а как обычный 
регистровый массив с произвольным доступом. Однако регистровый стек сопро- 
цессора не может одновременно использоваться и по своему прямому назначению, 
и как ММХ-расширение, поэтому забота о его разделении и корректной работе 
с ним ложится на программиста. Отображение ММХ-регистров на регистры стека 
сопроцессора иллюстрирует рис. 10.2. 

При выполнении ММХ-команд сопроцессор переводится в состояние, которое 
характеризуется следующими признаками: : 

регистр тегов сопроцессора обнуляется; 

все регистры стека сопроцессора в ММХ-режиме адресуются физически вне 

зависимости от значений поля Т0$ регистра состояния $\В (поле Т0$, кстати, 

тоже обнуляется); 

ММХ-регистру ЕММХО соответствует физический регистр сопроцессора Кб, ММХ- 

регистру ЕММХ1 — К1 ит. д., при этом логическая нумерация регистров сопро- 

цессора не имеет никакого значения; 


содержимое других регистров сопроцессора не изменяется (за исключением 
случая применения команды ЕММ5); 


при записи в ММХ-регистр данных в младшие 64 бита заносятся сами записы- 
ваемые данные, а вбиты 64-79 — единицы, чтобы при попытке случайного или 
преднамеренного использования командой сопроцессора ММХ-данных не воз- 
никло какого-либо исключения сопроцессора; 


при чтении данных из ММХ-регистров их содержимое не изменяется. 


Особенности команд ММХ-расширения 


Важное отличие ММХ-команд от обычных команд процессора — в том, как они 
реагируют на ситуации переполнения и заема. В разделе «Арифметические опера- 
ции над целыми двоичными числами» урока 8 учебника нами разбирались ситуа- 
ции, когда результат арифметической операции выходил за разрядную сетку ис- 
ходных операндов. В этом случае производится усечение старших битов результата 
и возвращаются только те биты, которые умещаются в пределах исходного опе- 
ранда. Этот принцип формирования результата называется арифметикой с цикли- 
ческим переносом (\тарагоип4 агиптейс). Некоторые ММХ-команды в подобной 
ситуации действуют иначе. В случае выхода значения результата за пределы опе- 
ранда в нем фиксируется максимальное или минимальное значение. Такой прин- 
ции формирования результата называется арифметикой с насыщением (ЗабигаНоп 
ат тейс). ММХ-команды выполняют арифметические операции с использова- 
нием обоих принципов. При этом среди них есть команды, учитывающие знаки 
(значения старших битов) элементов операндов. Принцип формирования резуль- 
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татов арифметических операций с циклическим переносом вы можете прочитать 
в материале главы 8 учебника, здесь же рассмотрим на примерах, как формируют- 
ся результаты в ММХ-командах сложения и вычитания, работающих по принци- 
пу насыщения. 

Сложение чисел (беззнаковое насыщение): 

254 = 11111110 

+ 

5 = 00000101 


259 <> 11111111 


Результат ММХ-сложения с беззнаковым насыщением равен 255. При сложе- 
нии командами процессора АО и АБС, использующими принцип циклического 
переноса, результат равен 00000011 = 3, а флаг СЕ устанавливается в 1. Это свиде- 
тельствует о факте переполнения. 

Сложение чисел (знаковое насыщение): 

+126 = 11111110 или —126 = 10000010 

+ 

+5 = 00000101—5 = 11111011 


131 <> 01111111-131<> 10000000 


Результат ММХ-сложения со знаковым насыщенисм двух положительных чи- 
сел равен 127. При сложении командами процессора АБО и АБС, использующими 
принцип циклического переноса, результат равен 00000011 = 3, а флаг СЕ установ- 
ленв 1. Это свидетельствует о факте переполнения. 

Вычитание чисел (беззнаковое насыщение): 


05 = 00000101 


10 = 00001010 

—5 <> 00000000 

Результат ММХ-вычитания с беззнаковым насыщением двух чисел равен 001. 
При вычитании командами процессора $ЦВ и $ВВ, использующими принцип цик- 
лического переноса, результат равен 11111011 = —5 вдополнительном коде, а флаг 
СЕ устанавливается в 1. Это свидетельствует о факте воображаемого заема едини- 
цы из старшего разряда. 

Вычитание чисел (знаковое насыщение): 

+05 = 00000101 или-5 = 11111011 


—126 = 100000010-126 = 01111110 


—131 <> 01111111-131 <> 10000000 

Результат ММХ-вычитания со знаковым насыщеннем двух чисел равен 801. 
Это минимально возможное отрицательное чигло разме] м в байт. При вычита- 
нии командами процессора $ЦВ и $ВВ, использующими прииии циклическоготе- 
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реноса, результат равен 11111011 = —5 в дополнительном коде, а флаг СЕ устанав- 
ливается в 1. Это свидетельствует о факте воображаемого заема единицы из стар- 
шего разряда. 

Подобные рассуждения относятся и к некоторым другим ММХ-командам, не 
являющимся арифметическими. В табл. 10.1 представлены граничные значения 
насыщения для всех четырех типов данных ММХ-расширения. 


Таблица 10.1. Граничные значения насыщения ММХ-данных 




















Учетверенное слово со знаком | (8000000000000000...7 ЕЕ ЕНЕНЕЕНЕРР 





Отметим некоторые особенности практического использования команд ММХ- 
расширения. 

Не все трансляторы языка ассемблера поддерживают ММХ-команды. Это от- 
носится к трансляторам ТАЗМ версии 5.0 и МАЗМ версии 6.11. В качестве трансля- 
тора, поддерживающего ММХ-команды, можно рекомендовать транслятор 
МАЗ$М от Мегмае, информацию о котором можно найти в Интернете по адресу 
ВЕр:/Лмми.сгуодеп.сот/пазт/. А что же делать тем, кто располагает транслятором 
ТАЗМ или МАЗМ и не имеет возможности воспользоваться услугами МАЗМ? 
Выход здесь один — писать программу в машинных кодах, и дело это не такое уж 
безнадежное. Фирма п предвидела возникновение подобной проблемы и пред- 
ложила вариант включаемого файла 1аттх.1пс для транслятора ассемблера от 
Мсгозой. Он содержит варианты макроопределений для всех мнемоник ММХ- 
команд. Включив этот файл директивой 1паиде в начало вашей программы, вы 
можете использовать все ММХ-команды в определенном формате. С транслято- 
ром ТАЗМ этот файл, увы, напрямую не работает. Его нужно предварительно не- 
много скорректировать. Ситуация усложняется тем, что в пакет ассемблера ТАЗМ 
входят два транслятора: 16-разрядный (фазт.ехе) и 32-разрядный ({азт32.ехе). Раз- 
рабатываемые с их помощью программы имеют свои особенности. Этих особенно- 
стей достаточно много, поэтому здесь будет изложена методика, благодаря кото- 
рой вы сумеете разрабатывать программы с ММХ-командами для обоих типов 
трансляторов. Если же в вашем распоряжении есть другие средства для написания 
ММХ-программ, к вашим услугам материал данного урока только в части, касаю- 
щейся описания форматов ММХ-команд и примеров их применения. 

Перед началом работы доведем текст включаемого файла 1аттх.1пс до рабочего 
состояния, пригодного для транслятора ТАЗМ 5.0. Для этого нам придется делать 
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два варианта этого файла — 16- и 32-разрядный. Назовем их, соответственно, 
ттх164пс и ттх321пс. Они будут использоваться при написании программ, обра- 
батываемых 16- и 32-разрядными трансляторами ассемблера ({азт.ехе и {азт32.ехе). 
Эти варианты включаемых файлов предназначены для работы в режиме МАЗМ 
транслятора ТАЗМ 5.0. Объем исходных текстов включаемых файлов ттх16 пс 
и ттх32.4пс достаточно велик, поэтому они находятся среди файлов, прилагаемых 
к книге. (Все имеющие отношение к книге файлы можно найти по адресу ВЕр:// 
ммм .рег.сот/домиоа4.) Отличий в этих файлах два: 


вттх16.тс для моделирования ММХ-команд используются 16-разрядные ре- 
гистры общего назначения, а в ттх324пс — 32-разрядные регистры; 


» вттхАпс для выяснения типа операнда задействуется оператор „ТУРЕ. У автора 
при попытке указать эту директиву совместно с {а5т32.ехе возникала ошибка, 
которую удалось преодолеть только прн применении аналогичного оператора 
для режима Ш4еа! — $УМТУРЕ. 


Можно попытаться объединить эти два файла и препроцессорными средства- 
ми ассемблера распознавать текущую вычислительную ситуацию, но больного 
смысла тут нет, так как обычно 16- и 32-разрядные коды не пересекаются. Проще 
разработать два файла для каждой из технологий и так избежать потенциальных 
ошибок. Поскольку содержательная часть этих файлов практически одинакова, ссть 
смысл рассматривать только один из них, отмечая при необходимости имеющиеся 
отличия. 

Рассмотрим структуру файла ттх16.1пс. Этот файл содержит макроопределе- 
ния, каждое из которых моделирует определенную ММХ-команду. В качестве ос- 
новы для моделирования выступает команда основного процессора, которая дол- 
жна удовлетворять определенным требованиям. Каковы они? В поисках ответа 
рассмотрим машинные коды ММХ-команд. Видно, что общими у них являются 
два момента: 

поле кода операции ММХ-команд состоит из двух байтов, первый из которых 

равен ОЙ; г 


все ММХ-команлы, за исключением команды етт$, используют форматы ад- 
ресации с байтами тодаК/М и $1 и, соответственно, допускают сочетание оне- 
рандов как обычные двухоперандные команды целочисленного устройства — 
регистр-регистр или память-регистр. 


Для моделирования ММХ-команд нужно подобрать такую команду основного 
процессора, которая удовлетворяет обоим условиям. Проанализировав с позиций 
этих требований машинные коды команд основного процессора, выберем для мо- 
делирования команды ХАОО и ВТ. В процессе моделирования на место второго байта 
кода операции этих команд помещается байт со значением кода операции ММХ- 
команды. Когда процессор «видит», что очередная команда является ММХ-коман- 
дой, то он начинает трактовать коды регистров в машинной команде как коды 
ММХ-регистров и ссылки на память размерностью, соответствующей данной ко- 
манде. В машинном формате команды нет символических названий регистров, 
которыми мы пользуемся при написании исходного текста программы, например 
АХ или ВХ. Во внутреннем представлении они определенным образом кодируются. 
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Например, регистр АХ кодируется в поле гед машинной команды как 000 (см. гла- 
ву б учебника). Если заменить код операции команды, в которой одним из операн- 
дов является регистр АХ, кодом операции некоторой ММХ-команлды, то это же зна- 
чение в поле гед процессор будет трактовать как регистр КММХО. Таким образом, 
в ММХ-командах коды регистров воспринимаются соответственно коду операции. 
В табл. 10.2 приведены коды регистров общего назначения и соответствующих им 
ММХ-регистров. В правом столбце этой таблицы содержится условное обозначс- 
ние ММХ-регистров, принятое в файле ттх16.1пс. 


Таблица 10.2. Кодировка ММХ-регистров в машинном коде команды 


ГАА | мм | 
р | мм 
10 
Г Е ох ль Ме 


Это же соответствие закреплено рядом следующих определений в этом файле: 


гих еди <ах> 
гттх] еди <сх> 
гих? еди <@х> 
гитх3 еди <Бх> 
гтх4 еди <$р> 
гитх5 еди <6р> 
гтихб еди <$1> 
гитх7 еди <01> 


В файле ттх32 пс эти же определения выглядят так: 
гиих0 еди <еах> 
гттх] еди <есх> 
гих? еди <едх> 
гитх3 еди <еБх> 
гиих4 еди <езр> 
гтих5 еди <ебр> 
гттхб еци <е51> 
гитх7 еди <е41> 

Теперь в исходном тексте программы можно использовать символические имена 
ММХ-регистров в качестве аргументов макрокоманд, моделирующих ММХ-ко- 
манды. 

Рассмотрим, как в файле ттх16Апс описано макроопределение для мотелиро- 
вания ММХ-команды РАСК$$\МВ, предназначенной для упаковки с насыщением слов 
в байты. 
<1> раск$5иб  масго 4е5%:гед. $гс:гед 
<2> 1оса!\ рге. роз% 
<3> рге: 
<4> хада $гс, де5+ 
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<5> ро$ё 

<б> 0гд рге + 1 

<7> [1] _орс_раск$5мб 
<8> 0г9 роз 

<9> епт 


Понимание структуры приведенного макроопределения не должно вызвать 
у читателя трудностей. Центральное место здесь занимает команда целочисленно- 
го устройства (в данном случае ХАОО) и директива ОКб. Директива ОВб предназна- 
чена для изменения значения счетчика адреса (см. главу 10 учебника). В строке 6 
директива ОКб устанавливает значение счетчика адреса равным адресу рге + 1. Адрес 
метки рге является адресом первого байта машинного кода команды ХАОО. Соот- 
ветственно, если этот адрес увеличить на 1, то получим адрес второго байта кода 
операции. Таким образом, значением текущего счетчика адреса в строке 7 будет 
адрес рге + 1. Директива ОВ в строке 7 размещает по этому адресу значение 
орс_расК$$\Ъ, которое соответствует второму байту кода операции ММХ-команды 
РАСК$$МВ (см. выше). Директива ОВб в строке 8 устанавливает значение счетчика 
адреса равным значению адреса следующей после ХАОО команды. Для дотошных 
читателей замечу еще один характерный момент. Для полного понимания необхо- 
димо хорошо представлять себе формат машинной команды и назначение его по- 
лей. Достаточно полная информация об этом приведена в материалах главы 3 и 
приложения А учебника Обратите внимание на порядок следования операндов в за- 
головке макрокоманды, который построен по обычной схеме: коп приемник, источник. 
В ко- манде ХАОО порядок обратный, как требует синтаксис. Это хорошо поясняет 
назначение бита 9 во втором байте кода операции, который характеризует направле- 
ние передачи данных: в процессор (в регистр) или в память из процессора (регистра). 
Вы можете провести эксперимент. Проанализируйте машинные коды команды МО\: 
„дата 


р Фи 0 

.соде 
пом. р. 6х ; машинный код: 89 1е 00 00, 9=1. м=1 
[Ще Ьх. р : машинный код: 8Ь 1е 00 00. 9=0. м=1 


Из приведенного фрагмента видно, что изменение типов источника и прием- 
ника на обратный влияет только на поле кода операции, а именно на его второй 
бит. Это бит 9 (ОБиесбогу — направление), который определяет направление пере- 
дачи. Если приемник — регистр, то бит $ = 1, а это означает передачу из памяти 
в процессор (регистр). И наоборот, если приемник — адрес памяти, то бит 9 = 0, то 
есть имеет место передача из процессора (регистра) в память. Таким образом, зна- 
чения полей в остальных байтах машинного кода операции лишь определяют мес- 
тоположение операндов и не зависят от реального направления передачи. Напри- 
мер, значение второго байта кода операции орс_раск$$\Ь равно 63} (01100011Ъ). 
Он имеет значение бита 4 = 1, то есть данные передаются из регистра в память. Это 
нам и позволило в команде ХАОО изменить порядок следования операндов (иначе 
транслятор ассемблера эту команду не пропустит — подумайте, почему?). 

В связи с обсуждаемым моментом интересно посмотреть макроопределение 
другой ММХ-команды — МОУ: 


<1> тома масго  4е5%:гед. згс:гед 
<2> ]оса} рге. розЕ 
<3> 1 (.Зуре(ае$1)) апа 10и 
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<4> рге: 

<5> хадЧ $гс. Че5Е 
<6> роз: 

<7> огд рге + 1 

<8> [в _орс_пюма_19 
<9> ог9 розф 

<10> е15е 

<11> рге: 

<12> хада Че5ф. $гс 
<13> ро$ё: 

<14> ог рге + 1 
<15> |) _©рс_пюм@_$% 
<16> ог9 ро$® 

<17> еп 

<18> епт 


Команда МОУО позволяет производить передачу в обоих направлениях: память- 
процессор и процессор-память. Для того чтобы правильно смоделировать машин- 
ное представление ММХ-команды, необходимо определить, каким объектом яв- 
ляется операнд 4е5{ (приемник): ячейкой памяти или регистром. После этого будет 
ясен тип второго операнда, так как реализованы могут быть лишь две схемы рас- 
положения операндов: регистр-регистр и память-регистр. Для выяснения типа 
операнда ассемблер предоставляет оператор Хуре, который имеет следующий син- 
таксис: 

.Фуре выражение 

Оператор Ауре в зависимости от типа операнда выражение возвращает байто- 
вые значения, которые представлены в табл. 10.3. В строке 3 листинга выше опре- 
деляется тип операнда де$4 и, если это регистр, то формируется один код операции 
(строки 4-10), если нет, то другой (строки 11—17). Кстати, МОМО — это единствен- 
ная ММХ-команда, которая выпадает из общей схемы построения ММХ-команд, 
так как только она позволяет производить обмен с 32-разрядным регистром обще- 
го назначения. 


Таблица 10.3. Операнды и возвращаемые значения оператора {туре 





Адреса операндов в памяти формируются таким же образом, как и для цело- 
численных команд, а их трактовка зависит от конкретной ММХ-команды. Более 
детально с моделированием остальных ММХ-команд вы можете познакомиться, 
изучив тексты включаемых файлов ттх16.1пс и ттх32.1пс, которые имеются среди 
файлов, прилагаемых к книге. 
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Далее мы рассмотрим ММХ-команды, сопровождая описание характерными 
примерами, демонстрирующими механизм работы команд. В конце раздела будет 
приведен типовой пример использования ММХ-команд. 


Система команд 
ММХ-команды по функциональному признаку делятся на группы (рис. 10.3). 


Команды ММХ-расширения 


(целочисленного) 
[ Инцнализации | Упаковки Поресылии 
(сжатия) данных 
971115 ретредь/м/а рем! рапа 
рстраь^м М | [редаьлмя ен р и ге 
р суд 
рад9зЬ^м раскизмЬ : 
раади$Ь^№м ранит ЧИ Срхог ый 
расширением 
рз\ББАМА окно 
ри 
речь зом рипроквид 
рзибизЬ/№м рипрскнад 
рипрскЬм 


рии Дополнительные ММХ-команды рипрекм9 
рии (Репбит Ш) рупро9а 
ртадаиа 
Г Извлечения 
Вычисления еремещения аа 


ртом 
рамаь/№м рехлм 
ри Ним рпейм 
Суммарная Извлечение 
разница максимального 
ради ртахиб/м 
Извлечение 
минимального 
рипиБ/вм 
репим 


Рис. 10.3. Классификация целочисленных ММХ-команд 


Рассмотрим выделенные классы команд и укажем особенности их применения 
на примерах. 


Команды передачи данных 


ММХ-команды пересылки, подобно их целочисленным аналогам, являются наи- 

более часто используемыми. Эти команды осуществляют передачу информации 

в ММХ-регистры и из регистров. ММХ-команды пересылки работают с 32- и 64- 

разрядными операндами. Ниже перечислены команды, входящие в данную группу. 

®_ МО\О приемник, источник — пересылка 32 битов из источника в приемник. Один 
из операндов, источник или приемник, но не оба одновременно, должен быть 
ММХ-регистром. Другой операнд должен быть 32-разрядным регистром или 
32-разрядной ячейкой памяти. 
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®_ МОМ приемник, источник — пересылка 64 битов из источника в приемник. В от- 
личие от команды МО\О, оба операнда команды МО\ могут быть ММХ-регист- 
рами. Если же операнды смешанные, то один из операндов, источник или прием- 
ник, должен быть ММХ-регистром, а другой — адресом 64-разрядной ячейки 
памяти. 


Команда МОУО работает только с младшей половиной ММХ-регистра. Для дос- 
тупа к старшей части ММХ-регистра необходим либо сдвиг, либо команда МОМ. 
Команда МО\О является единственной ММХ-командой, допускающей использо- 
вание в качестве операндов 32-разрядных регистров общего назначения. Это же 
обстоятельство является причиной того, что при применении в качестве приемни- 
ка регистра общего назначения макрокоманда МО\О будет работать неправильно. 
Для того чтобы понять, в чем здесь дело, посмотрим еще раз на макроопределение, 
моделирующее эту ММХ-команду: 


МоУа масго 4е5$%:гед. згс:гед 
1оса1 рге. ро$% 
1Р (.$уре(де$®)) апа 101 


рге: хада 5гс. 9е5% 
ро$т: 0г9 рге + 1 
[е]°) _ орс_птома_19 
0г9 розу 
е15е 
рге: хаба Чезф, $гс 
роз: 0гд рге + 1 
[#15] _орс_пюм@_5& 
ог ро$е 
епо1Р 
епдт 


Допустимые сочетания операндов для команды МО\О следующие: 


тома пет32. гитх 
под гитх, тетЗ2 
пуд гттх, гЗё 
пома г3З2, гитх 


Приведенное макроопределение хорошо работает при первых трех сочетаниях 
операндов, а в последнем случае оно перестает понимать, что от него хотят, и дает 
сбой. Этому две причины. Во-первых, оператор фуре (5УМТУРЕ в режиме П4еа1) одина- 
ково реагирует на сочетания МОУ гтмх, г32 и то\4 гЗ2, гтитх, так как в результате 
макроподстановки операнд гтмх заменяется одним из регистров г32. Поэтому 
в обоих случаях генерируется команда ХАОО иттх, г32 со вторым байтом кода опе- 
рации, равным бер. ММХ-команда с этим кодом операции предполагает пересылку 
32 битов из памяти или регистра общего назначения, но не наоборот. Для пере- 
сылки из регистра общего назначения (32-разрядной ячейки памяти) в ММХ-ре- 
гистр требуется машинная команда со вторым байтом кода операции 7еВ. Вторая 
причина является следствием первой. Так как ММХ-регистры и регистры общего 
назначения кодируются в машинной команде одинаково, то для конкретной ма- 
шинной команды по заложенной в ней схеме различают, какой из операндов явля- 
ется ММХ-регистром, а какой — регистром общего назначения, и для указанного 
выше сочетания операндов это делается неправильно. Как выйти из положения? 
Можно, конечно, выполнить дополнительный анализ передаваемых в макрокоман- 
ду аргументов, но мы, учитывая единичность данного случая, пошли по самому 
легкому пути — включили в файл ттх//пс дополнительное макроопределение 
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МОУОКЗ2г. Это макроопределение специально предназначено для случая пересыл- 
ки данных из ММХ-регистра в 32-разрядный регистр общего назначения. 

Следующий важный вопрос связан с тем, как описывать данные для работы 
с ММХ-командами. Здесь также приходится учитыватьто обстоятельство, что при 
использовании пакета ТАЗМ (как, впрочем, и МАЗМ) ММХ-команды приходит- 
ся моделировать. Главное здесь — понять последовательность этого моделирова- 
ния: на этапе трансляции моделируются операнды целочисленной команды (в на- 
шем случае — ХАБ) и формируется поле кода операции в машинной команде (ее 
второй байт). Далее на этапе исполнения программы выполняется должная ин- 
терпретация операндов команды. Если посмотреть на описание команды ХАОО, то 
легко увидеть, что она может работать максимум с 32-разрядными операндами. 
А как же быть, если требуется моделировать ММХ-команду, манипулирующую 
64-разрядными операндами? В этом случае приходится в очередной раз занимать- 
ся обманом. Например, следующий фрагмент программы будет ошибочным: 


тис1цае птх. Тис 

. Чата 

тетб4 99 1111222233334444п 
.соде РА’ 


Пома — гиихО. петб4 


Ошибка возникнет из-за того, что на этапе трансляции будет смоделирована 
команда ХАОВ ах, тетб4, которую транслятор не пропустит из-за несовпадения тн- 
пов операндов. Суть «подлога» состоит в следующем описанин данных: 


1ис1цае их. Тис 
. дата 
петб4 [6 44440 


[Я 1111222233338 
. сое вы 
Ома гитх0. тетбА 
Помните, что при описании операнда в памяти продолжает действовать прин- 
цип размещения данных в памяти «младший байт по младшему адресу». При ра- 


боте с 32-разрядным ассемблером {азт32.ехе описание данных должно быть вы- 
полнено так: 


1пс1иде птх32.1пс 
. Чата 
петб4 [66 333344448 


94 111122221 
.соде в 
моча гих. тетб4 


Ниже приведены примеры команд нересылки данных. Текст программы исполь- 
зуйте в качестве основы для разработки других программ в этой главе. Далее для 
экономии места будут приводиться только фрагменты соответствующих программ. 


<1> ; пх16.а5т 
<2> .586р 
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<3> тоде] изе16 $та1] :; изе16 обязательно 

<4> ЗМОТМСЕ : запретить вывод текста включаемых файлов 

<5> тасТиде птх16.1пс 

<6> .$фаск 1001 

<7> .даба ; сегмент данных 

<8> тет 4 м 44448 

<9> 41 111122223333/ 

<10> тет] дм ЗН 

<11> + 0002сссс0004и 

<12> тетё дм ОН 

<13> + 000198990 т03н 

<]4> тет3 ам 7ЕРЕ 

<15> 4 000189990103И 

<16> .соде 

<17> тай ргос : начало процедуры талп 

<18> тоу ах. @даба 

<19> пюу 45. ах 

<20> 

<21> пю\@ гитх0. тет : гитх0=0000 0000 3333 4444 

<22> пю\дгЗ2 ах. гитхО : гитх0=0000 0000 3333 4444. еах-3333 4444 

<23> пюу\а гитх0. тет] ; гттх0=0002 сссс 0004 0003 

<24> пю\д петё. гттх0 ; тет2=0300 0400 сссс 0200. гптх0=0002 
сссс 0004 0003 

<25> рхог гитхб. гитхО : гитх0=0000 0000 0000 0000 

<26> по\д тетЗ. гттх0 : тет3=0000 0000 0000 0000 


<27> етт5 

<28> оу ах. 4с00И : пересылка 4с00Н в регистр ах 

<29> и 21 : вызов прерывания с номером 211 
<30> та?" епдр ; конец процедуры тат 

<3]> еп та1п : конец программы с точкой входа татп 


Обратите внимание на строку 22, в которой команда МОМ (в учебнике мы об- 
суждали эту команду и соответствующую ей макрокоманду МО\МОКЗ2) пересылает 
32 бита в регистр общего назначения, но при этом указывается 16-разрядный ре- 
гистр АХ. Указать впрямую ЕАХ нельзя, так как для 16-разрядного ассемблера вме- 
сто ЕММХО в ходе моделирования подставляется АХ (см. определения в ттх161пс). 
На этапе выполнения все расставляется на свои места, так как требуемую пере- 
сылку (из ЕММХО в ЕАХ) производит микропрограмма, реализующая ММХ-коман- 
ду МО\УО по полю кода операции и коду регистра, который, как видно из табл. 10.3, 
одинаков для регистров АХ и ЕАХ. 

Здесь уместно уделить внимание еще одной проблеме, которая неизбежно встает 
на определенном этапе разработки программы — какие отладочные средства мож- 
но использовать для просмотра результатов работы ММХ-команд? Можно попро- 
бовать подыскать отладчик, поддерживающий работу с ММХ-расширением, но это 
делать совсем не обязательно. Понимание того, что ММХ-расширение архитек- 
турно создано на базе сопроцессора, дает вам возможность использовать практи- 
чески любой отладчик для работы с ММХ-приложениями, в том числе ТигБо 
Оефиврег. При этом, конечно, необходимо соблюдать определенные ограничения, 
источник возникновения которых в том, что Тигро Оефирвег ничего не знает 
о ММХ-командах. Это обстоятельство может приводить к его неадекватной рабо- 
те. Но если следовать некоторым рекомендациям, то можно пройти над «подвод- 
ными камнями», не задев их. 

В пакете ТАЗМ версии 5.0 есть два варианта отладчика ТигБо ОеБирвег: 


Ч.ехе — для разработки 16-разрядных программ; 
# 32.ехе — для разработки 32-разрядных приложений. 
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В основном, все сказанное ниже касается любого из этих отладчиков, так как 
проблема у них общая — непонимание мнемоники ММХ-команд. 

Чтобы создать исполняемый файл, пригодный для отладки, задайте в качестве 
параметра транслятора (азт.ехе или фа$т32.ехе) ключ /71, а для компоновщика 
({ИпК.ехе или Е 1тКЗ2.ехе) — ключ /\. Загрузите исполняемый файл в отладчик (ис- 
ходный текст появится в окне Модще). 

Теперь «в уме» разделите программу на фрагменты двух типов: содержащие 
ММХ-команлды и без них. С фрагментами, не содержащими ММХ-команд, вы мо- 
жете работать в обычном режиме. Для отладки программы на фрагментах, вклю- 
чающих в себя ММХ-команды, перейдите в окно СРИ (Щем › СРИ), а также открой- 
те окно Митейс ргосеззог (\Уем » Митейс ргосез5ог). После этого окно отладчика 
должно выглядеть так, как показано на рис. 10.4. 


Те фот бгеакрог а Ма МрНопа ло Мер ЕЙ 
мих16 Ре: ммх1 * ]-=СРИ еп 
ны РОЗ АС 
.соде с5: @О0А»>аь @Е 
пап ргос ‘:эрбрыю яЁюЧхееЁ{| сз:0008 31е ЕЕСО 
поу ах, @Ча{а Нитх16Н770604 
моу 4$, ак 3:0000 4 (Е 


с$:000Е оц 
поу гиих@, мем  ;гиих0=0| сз:600Е ризь 
поудг32 ах, гимх@ ; гиюхб= 
моуа гиих@’ тей] ‘гимх0-0|20 06 9Е 00 9Я Е@ ЕЕ - гЯ ЪЕЙ :0102 0803 
моу мен? гимхб ‘шем2=03 |Е@ 32, ов, С7 16 @Е 67 м 55:0100>52ЕВ 
рхог гилв. гипх@ ;гиих@=0 "$ 

мем3 ‚гиих@ ;пеп3=0000 0006 Е 0000 


мо 
80387 РТ АВВ 0РС00Е-609 ОРТВ=126 
Зрес. $1(0) -Н Е 0000 0000 3333 4444 
















е5 



















ее ТО) МНН ГЕЕЕ ЕР93 ЕГВ2 РЕЙб ГР97 
рес. $1(2] МАН ГЕЕЕ ЕЕЕР ЕР9З ЕРЕЕ ЕЕВ2 
Гего $Т(3) в 0006 0000 0008 0000 0006 
Ма] 14 $1(4) 6. 50376134889753567 ЗЕЕ 8@Е6 80Рб 80Е6 8@Еб 
Уа114 $Т(5) -390293.89863740703 С011 ВЕ92 ВСВС В8Е1 8897 

брес. $1(6) -ТЕ ГЕЕЕ 8006 0006 0006 0006 | ; 
: $77) 7ЕЕЕ 8000 0000 0008 0000 










Г/-Тгасе Ш-5{ер №)-Вип №-Мепи 


Рис. 10.4. Вид отладчика при работе с ММХ-командами 


Сам процесс отладки традиционен ‚и вы можете управлять им, используя при- 
вычные средства ТигЬо ОеБиррег. 


Арифметические команды 

В группу арифметических входят команды для реализации трех основных ариф- 
метических операций: сложения, вычитания, умножения. При этом, как мы уже 
отметили выше, для операций сложения и вычитания предусмотрены команды, 
учитывающие знак операндов (значение старшего бита). 


Сложение 

Команды сложения делятся на две подгруппы, ИСХОДЯ ИЗ Того, Как формируется 
результат при возникновении переполнения — по принципу насыщения или по 
принципу циклического переноса. 
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* РАООВ | РАБОМ! | РАООВ приемник, источник — сложение беззнаковых упакованных 
байтов, слов, двойных слов. Результат помещается в приемник, который явля- 
ется одним из ММХ-регистров. Источник — либо ММХ-регистр, либо 64-раз- 
рядная ячейка памяти. При переполнении результат формируется по принципу 
циклического переноса (см. выше подраздел «Особенности команд ММХ-рас- 
ширения»). Перенос теряется и нигде не учитывается. 


„дата 
пет 9м 44440 
[63 1111222233331 
пет] Чи ОТЕРев 
(6 ОЕЕЕСЕЕРОТЕЕТН 
„соде 
ПЮУЧ гтихо. тет ; гитихО = 11 11 22 22 33 33 44 44 
; метр = Е м М М М 
рада — гттх0, тет] : гииихО = 10 03 21 12 32 32 43 42 


РАООЗВ | РАБО$\ приемник, источник — сложение упакованных байтов и слов со 
знаком. Результат помещается в приемник, который является одним из ММХ- 
регистров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. 
При возникновении переполнения результат формируется по принципу зна- 
кового насыщения (см. выше подраздел «Особенности команд ММХ-расшире- 


НИЯ»). 
„дара 
тет [6 44440 
[61 1111222233828 
тет] Ом 0157ев 
[61 0717С 3747 Рав 
.со4е 
пома  гиихО. пет ; гихо = 11 11 22 22 33 82 44 44 
: Мет] = 71 7с З+ 74 7+ Та 15 7е 


раба$6 гттхО. тет1 ; гиихО = 7 7 61 7 7+ 80 59 7Е 


Исходные данные этого примера подобраны так, чтобы было видно, как при 
переполнении формируется результат по принципу знакового насыщения. Срав- 
ните их с теми результатами, которые получаются в результате работы следую- 
щих команд. 

РАОСИ$В | РАВОИ$М приемник, источник — сложение беззнаковых упакованных 
байтов и слов. Результат помещается в приемник, который является одним из 
ММХ-регистров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка 
памяти. При возникновении переполнения результат формируется по принци- 
пу беззнакового насыщения. 


. дата 
мет [6 44440 

[6 1111222233821 
пет] [6 0157еп 

[61 07173747 Рай 
„сое 


по\а  гиихО. пет : гихо = 11 11 22 22 33 82 44 44 
; пет] = 71 7С З+ 74 74 Та 15 7е 
рабдиз$Ь гттхо. тет] ; пхО = 82 84 61 9Р Б2 ++ 59 с2 
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Вычитание 


Набор команд вычитания аналогичен командам сложения и содержит три группы 
команд; обработки беззнаковых операндов традиционным для целочисленного ус- 
тройства способом — по принципу циклического переноса; обработки беззнако- 
вых операндов по принципу беззнакового насыщения; обработки знаковых опе- 
рандов по принципу знакового насыщения. 
РУВВ | РЗИВМ | РЗИВО приемник, источник — вычитание беззнаковых упакован- 
ных байтов, слов, двойных слов. Результат помещается в приемник, который 
является одним из ММХ-регистров. Источник — либо ММХ-регистр, либо 64- 
разрядная ячейка памяти. При переполнении результат формируется по прин- 
ципу циклического переноса, то есть так, как это делается командами 508 и $ВВ 
процессора. Заем из старшего разряда, естественно, теряется и нигде не учиты- 
вается. 


„Дата 
тет [#1 44440 
д+ 1111222233828 
пет] [6 157ей 
[6 11231797 аи 
.соае 
ПОУЧ гиихо. тет :; стихо = 1111 2222 3382 4444 
: Мет] = 1123 1747 Ран 157е 
рзиби  гхО. тет ; гихО = ОТЕТ е2а5 6388 2есб 


» РЗИВЗВ | РЗУВ$М/ приемник, источник — вычитание упакованных байтов и слов со 
знаком. Результат помещается в приемник, который является одним из ММХ- 
регистров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. 
При возникновении ситуации, когда результат вычитания получается меньше 
801 (80006), поле соответствующего байта (слова) формируется по принципу 
знакового насыщения (в нем остается значение 801 (8000%)). Если результат 
больше 7 (7Н), то результат насыщается до значения 7 (7). 


„баба 
мет [1 5И 
ЧЕ 0111222233821 
пет] [6 80038 
97 7Ееде7а7 Ган 
.соде 
ОЧ гих. тет : гих = ТРЕТЬ 2222 3382 0005 
: петр = 7Ре 9174 71а 8003 


р$\65и гттхО. тет] ; гитхО = 8000 42а5 6388 7ЕР 


Первая и последняя тетрады показывают результат, сформированный в соот- 
ветствии с принципом знакового насыщения. 

® РЗИВОЗВ | РЗУВИ$М! приемник, источник — вычитание беззнаковых упакованных 
байтов и слов. Результат помещается в приемник, который является одним из 
ММХ-регистров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка 
памяти. При возникновении ситуации, когда результат вычитания получается 
меньше 001 (00008), поле соответствующего байта или слова формируется по 
принципу беззнакового насыщения (в нем остается значение 001 (00008)). 
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„Чата 
мет Ом 5И 
9+ 01+622223382/ 
тпет1 Чи 8003Зв 
[6 7е0+740т Тан 
.соде 
ПоУЯ гтих0. тет ; гимхо = РЕБ 2222 3382 0005 
; мет] = 7е 0179 ОРРа 8003 
рзибизи гттх0о, тет ; гихо = 769 12а5 2388 0000 


Обратите внимание на последнюю тетраду, которая соответствует результату 
вычитания (5 — 32 771). 


Умножение 


Команды ММХ-умножения предназначены только для умножения 16-разрядных 
элементов, причем реализация этих команд сделана несколько непривычно. Ко- 
манды умножения целочисленного устройства формируют результат, размер ко- 
торого вдвое превышает размер исходных операндов. Команды умножения ММХ- 
расширения реализуют это действие несколько иначе. Во-первых, умножению 
подвергаются одновременно 4 слова со знаком. Во-вторых, для получения полно- 
го результата умножения (размером в двойное слово) необходимо применение двух 
команд, РМИЕНМ! и РМУНМ.. С их помощью формируются соответственно старшая и 
младшая части произведения. Для объединения результата в единое двойное сло- 
во можно использовать команды расширения РИМРСКНМО или РУМРСКМО. 


РМУЕНМ приемник, источник — умножение четырех знаковых упакованных слов. 
Результат помещается в приемник, который является одним из ММХ-регист- 
ров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. В при- 
емник записываются не все 32 бита произведения, а только старшие 16 битов. 
Младшие 16 битов можно получить при помощи команды РМУИМ. 


»® РМУИМ приемник, источник — умножение знаковых упакованных слов. Резуль- 
тат помещается в приемник, который является одним из ММХ-регистров. Ис- 
точник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. В приемник 
записываются не все 32 бита произведения, а только младшие 16 битов. Стар- 
шие 16 битов можно получить, используя команду РМИЕН\. 


РМАОВБМГО приемник, источник — умножение четырех знаковых упакованных слов. 
Результат помещается в приемник, который является одним из ММХ-регист- 
ров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. Фор- 
мирование результата осуществляется по схеме, представленной на рис. 10.5. 


(97 Тс2 152 Га?) Приемник (ММХ-регистр) 


Промежуточные 
результаты 
(32 бита) 





Приемник (ММХ-регистр) 
Рис. 10.5. Схема работы команды РМАВОМ/О 


ее 
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Для иллюстрации работы команд РМОЕНИ и РМУЦМ рассмотрим пример умно- 
жения четырех знаковых слов. 


.дафа 
мет Ом 5А 
[619 7165222233828 
пет] 9м 8008 В 
[6 7+ е0т740т Тай 
петё [6 0 
[619 0 
петЗ Ом 0 
[Я 0 
со4е 
оУЧ гииохО. тет ; гих = 76 2222 3382 0005 


; мет] = 7Ее 0174 ОТРа 8008 
----- получим младшие части произведений 
рти11м — гитхО. тет] : гилхО = 800а а89а еа?4 8028 
поУа гитх1. пет ; ГИМХ] = 7 2222 3382 0005 
: етЁР = 7ЁЁе 0174 ОТРа 8003 
:----- получим старшие части произведений 


рии  гттх1. тет : гих] = ЗЕс 0210 0336 РТА 
=== сохраним глтх0 для последующих действий 
пОУа гиихё. гипхо : гих? = 800а а89а еа?4 8028 


== в поле тет? содержится результат произведений операндов 
; младших половин исходных операндов 
рипрскТмЧ гитхО. гитх1 ; гттх0=0336 еа{4 ТЕРА 8028 
ПоУа тетё, гтихо : ет2=0336 еаР4 РТА 8028 
газезне в поле тет3 полный результат произведений операндов 
: старших половин исходных операндов 
рипрсКВм гттх2, гттх1 : гттх2 = ЗЁЕРс 800а 0210 а8да 
мод пез, гитха ; мет3 = З{Рс 800а 0210 а89а 


Используя программу-калькулятор \Ит4о\уз, вы можете проверить получен- 
ные произведения. Вычислите с его помощью произведение 7НЪ х 7Йе = ЗНс800а. 
Такое же значение мы получили в поле тет3. Аналогично можно проверить и дру- 
гие результаты. 

Результат работы команды РМАОБМ/О представляет собой сумму произведений 
двух старших и двух младших слов операндов приемник и источник (см. рис. 10.5). 
Результат получается в виде двух двойных упакованных слов. Ниже показан при- 
мер использования команды РМАВОМО: 


дата 
мет [6 5Н 
ОЕ 711622223382Н 
тет] [6 80081 
ОЕ 7+ тедт7а0тТай 
Пета [6] 0 
[в 0 
пет3 0 0 
97 0 
„соде 
ПоУа гитх0. тет ; иахО = 72 2222 3382 0005 
; пет] = 7ЕЕе 0179 ОТРа 8008 
ртайама глитх0. тет] ; их = 4209 28а 0334 6Ы1с 
Команды сравнения 


Группа команд сравнения ММХ-расширения содержит команды двух типов. Ко- 
манды простого сравнения (РСМРЕСВ | РСМРЕСМ/ | РСМРЕЦО) характеризуются тем, 
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что устанавливают только факт равенства операндов (равно — не равно). Коман- 


ДЫ 


сравнения по величине (СМРЕТВ | РСМРСТМ | РСМРСТО) устанавливают соотноше- 


ние операндов по величине. 


РСМРЕСВ | РСМРЕСМ! | РСМРЕЦО операнд_1‚операнд_2 — сравнение упакованных 
байтов, слов или двойных слов. Результат формируется в первом операнде, ко- 
торый является одним из ММХ-регистров. Второй операнд — либо ММХ-ре- 
гистр, либо 64-разрядная ячейка памяти. Элементы результата представляют- 
ся в виде единичных или нулевых байтов, слов или двойных слов. Единичные 
байты, слова или двойные слова формируются, если соответствующие байты, 
слова или двойные слова исходных операндов равны. Нулевые байты, слова, 
двойные слова формируются, если соответствующие байты, слова или двой- 
ные слова исходных операндов не равны. 


.бата 
мет Ом 5А 
ЧЕ 7111222233821 
тет] [6 51 
ОЕ 7тебт7а0тав 
.соде 
ее гих, тет ; стихо = 7РРЕ 2222 3382 0005 
: мет] = 7е 0174 ОЁР+а 0005 
ты итихо. тет] : гитхО = 0000 0000 0000 ЕЕЕЕ 


РСМРЕТВ | РСМРОТМ | РСМРЕТО операнд_1, операнд_2 — сравнение по величине упа- 
кованных байтов, слов или двойных слов. Результат формируется в первом 
операнде, который является одним из ММХ-регистров. Второй операнд — либо 
ММХ-регистр, либо 64-разрядная ячейка памяти. Элементы результата пред- 
ставляются в виде единичных или нулевых байтов, слов или двойных слов. 
Единичные байты, слова, двойные слова формируются в случае, если байты, 
слова или двойные слова исходного операнда операнд_1 были больше соответ- 
ствующих байтов, слов или двойных слов операнда операнд_2. Иначе формпру- 
ются нулевые байты, слова или двойные слова. 


В примере ниже наглядно показано, что единичные элементы получаются только 


в случае, если элементы первого операнда (всегда находящегося в ММХ-регист- 
ре) больше соответствующих элементов второго операнда. 


.дафа 
мет м 5И 
ЧЕ 77222233821 
мет] Ом 5И 
ЧЕ 7Че0т7а0+ап 
.соде 
поуа гитхО, мет ; илтхО = 7РЕР 2222 3382 0005 
; петр = 7ЕРе 0179 ТОТа 0005 


ретрафм гттх0. тет] ; хо = ВЕРЕ РЕРЕ 0000 0000 


Команды логических операций 


Команды логических операций предназначены для поразрядной обработки содер- 
жимого двух ММХ-регистров или ММХ-регистра и 64-разрядного операнда в па- 
мяти. Эти команды реализуют логические операции И, И-НЕ, ИЛИ, исключаю- 
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щее ИЛИ. Заметьте, что появилась новая логическая операция И-НЕ, которой нет 

среди логических команд основного процессора (чистой булевой логики). Другая 

особенность логических команд заключается в том, что они выполняются над все- 
ми шестьюдесятью четырьмя разрядами ММХ-операндов. Для структурирования 
результатов их работы нужно применять другие команды ММХ-расширения. 

» РАМО приемник, источник — выполнение поразрядной операции И над операнда- 
ми. Результат помещается в приемник, который является одним из ММХ-ре- 
гистров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. 
Биты результата в приемнике формируются в соответствии с табл. 10.4. 


Таблица 10.4. Таблица истинности для операции И 





мет м 0505й 
[99а 7170022030801 
мет 9м 00058 
а 7410020001801 
соде 
пуд  гитхб. пет : гтихО = 7РР0 0220 3080 0505 
; ет] = 7710 0200 0180 0005 


рапа гиих0. тет] ; гттхО = 710 0200 0080 0005 


&# РАМОМ приемник, источник — выполнение поразрядной операции И-НЕ над опе- 
рандами. Результат помещается в приемник, который является одним из ММХ- 
регистров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. 
Биты результата в приемнике формируются в соответствии с табл. 10.5. Из таб- 
лицы видно, что единичные биты в результате могут появиться только в одном 
случае, когда единичные биты источника совпадают с нулевыми битами при- 
емника. Команда позволяет определить положение единичных битов источни- 
ка, которым не соответствуют единичные биты приемника. 


Таблица 10.5. Таблица истинности для операции И-НЕ 


Источник 
Результат 


Принцип работы команды РАМОМ иллюстрирует пример: 





„дата 
пет 9 05058 

[612 7110022030808 
пет] Чи 00058 


[619 7110030001800 
„собе 
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поуа гих, тет ; гихО = 7170 0220 3080 0505 
; пет = 760 0300 0180 0005 
рапбп  гттх0. тет] : гих = 0000 0100 0#00 0000 


® РОК приемник, источник — выполнение поразрядной операции ИЛИ над операн- 
дами. Результат помещается в приемник, который является одним из ММХ- 
регистров. Источник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. 
Биты результата в приемнике формируются в соответствии с табл. 10.6. 


Таблица 10.6. Таблица истинности для операции ИЛИ 


ЕО о м 


Принцип работы команды РОК иллюстрирует пример: 






.дата 
мет [6 05058 
ЧЕ 71100220308 0Н 
мет] [6 00051 
ЧЕ 7110030001808 
„сое 
па гитх0, тет ; гихО = 7РРО 0220 3080 0505 
; мет] = 7+0 0300 0180 0005 
рог гтихо. тет] ; гихО = 70 0320 3180 0505 


РХОК приемник, источник — выполнение поразрядной операции «исключающее 
ИЛИ» над операндами. Результат помещается в приемник, который является 
одним из ММХ-регистров. Источник — либо ММХ-регистр, либо 64-разряд- 
ная ячейка памяти. Биты результата в приемнике формируются в соответствии 
с табл. 10.7. 


Таблица 10.7. Таблица истинности для операции «исключающее ИЛИ» 





ВЕ ОБЕ С ОЕ = | 


Принцип работы команды РХОК иллюстрирует пример: 


. Дата 
мет Фи 05058 

[612 7110022030808 
тет] м 00058 

[Я 7110030001808 
„сое 


поу4  гипхо. пет ; гипх0=70 0220 3080 0505 
: ет] =7Е0 0300 0180 0005 
рхог глтх0. тет. : гитх0=0000 0120 3400 0500 
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Команды сдвига 


В главе 9 учебника мы знакомились с командами арифметического и логического 
сдвига основного процессора. Отличие этих двух типов команд сдвига — в способе 
интерпретации знакового бита операнда. Среди ММХ-команд сдвига также суще- 
ствуют команды арифметического и логического сдвига. Обратите внимание нато 
обстоятельство, что ММХ-команд сдвига упакованных байтов нет. Сдвигать мож- 
но только упакованные слова, двойные слова и учетверенные слова (целиком весь 
ММХ-регистр). 


* РММ | РЗ | РУ: приемник, источник — команды логического сдвига влево 
упакованных слов, двойных слов или учетверенных слов в приемнике на коли- 
чество разрядов, указанных значением источника. Результат помещается в при- 
емник, который является одним из ММХ-регистров. Источник — либо ММХ- 
регистр, либо 64-разрядная ячейка памяти. Освобождающиеся в результате 
сдвига младшие биты упакованных элементов приемника заполняются ну- 
лями. 


‚ РУЦМ | РЗЦ.О | РМО приемник, количество_сдвигов — команды логического сдви- 
га влево аналогичны рассмотренным выше командам за исключением того, что 
все упакованные слова, двойные слова и учетверенные слова в приемнике сдви- 
гаются на количество разрядов, указанных значением непосредственного опе- 
ранда количество_сдвигов. Освобождающиеся в результате сдвига младшие биты 
упакованных элементов приемника заполняются нулями. 


® РЭВ | РУКГО | РЗЕЕО приемник, источник — команды логического сдвига вправо 
упакованных слов, двойных слов или учетверенных слов в приемнике на коли- 
чество разрядов, указанных значением в источнике. Результат помещается 
в приемник, который является одним из ММХ-регистров. Источник — либо 
ММХ-регистр, либо 64-разрядная ячейка памяти. Освобождающиеся в резуль- 
тате сдвига старшие биты упакованных элементов приемника заполняются ну- 
лями. 


» РЭВ | РУКИ) | РУКИА приемник, количество_сдвигов — команды логического сдви- 
га вправо аналогичны рассмотренным выше командам за исключением того, 
что все упакованные слова, двойные слова или учетверенные слова в приемни- 
ке сдвигаются на количество разрядов, указанных значением непосредствен- 
ного операнда количество_сдвигов. Освобождающиеся в результате сдвига стар- 
шие биты упакованных элементов приемника заполняются нулями. 


„Вафа 
тет [#1 ОРЕЕЕА 
[в ОРЕРЕЕЕЕЕРЕЕЕЕИ 
тет1 [6 4 
0+ 0 
„сое 
пюу9 гиихО. тет ; илихО = УЕРЕ ВЕРЕ РЕРЕ ВЕЕР 
; мет] = 0000 0000 0000 0004 
р$1 1 гиих0. тет] ; гилхО = ЕРРО РЕРО ЕЕРО РР 


рзг1м гих. 4 : гихО = ОФЕЕ ОРРЕ ТЕР ОЕ 
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Следующие команды являются командами арифметического сдвига. Эти ко- 


манды сдвигают значение операнда вправо. Команд арифметического сдвига вле- 
во нет, так как они аналогичны командам логического сдвига, не сохраняющим 


значения знакового разряда. 


РЗУВАМ/ | Р5ВАО приемник, источник — команды арифметического сдвига вправо 
упакованных слов или двойных слов в приемнике на количество разрядов, ука- 
занных в источнике. Результат помещается в приемник, который является од- 
ним из ММХ-регистров. Источник — либо ММХ-регистр, либо 64-разрядная 
ячейка памяти. Освобождающиеся в результате сдвига старшие биты упако- 
ванных элементов приемника заполняются значением знаковых (старших) раз- 
рядов этих элементов. 


„Чата 
мет [6 ОТЕЕОН 
[9 ОТЕРОТЕРОРЕЕОВ 
мет]. Фи 4 
ЧР 0 
.соде 
поУа гитхО. тет ; итихО = РЕРО РЕРО РЕРО РЕТРО 
: мет] = 0000 0000 0000 0004 


рзгам  гттх0. 4 ; гих = ЕЕЕЕ РЕКЕ РАКЕ ЕЕ 


Команды упаковки и распаковки 


Команды упаковки и распаковки предназначены для изменения размерности эле- 
ментов операндов с учетом их значений. Команды упаковки позволяют уменьшить 
размерность злементов в два раза. При этом если значение сжимаемого элемента 
больше максимального допустимого значения, которое может содержаться в эле- 
менте меньшего размера, то результат формируется по принципу знакового насы- 
щения. 


РАСК$$0М!/ приемник, источник — команда упаковки со знаковым насыщением двух 
двойных слов в приемнике и двух двойных слов в источнике в четыре слова 
в приемнике. Схема выполнения команды показана на рис. 10.6. Результат по- 
мещается в приемник, который является одним из ММХ-регистров. Источник — 
либо ММХ-регистр, либо 64-разрядная ячейка памяти. 


раск$$Ам приемник, источник 
Источник 





Приемник (ММХ-регистр) 
Рис. 10.6. Схема работы команды РАСКЗОМУ/ 


РАСКУЗМВ приемник, источник — команда упаковки со знаковым насыщением че- 
тырех слов в приемнике и четырех слов в источнике в четыре слова в приемни- 
ке. Схема выполнения команды показана на рис. 10.7. Результат помещается 
в приемник, который является одним из ММХ-регистров. Источник — либо 
ММХ-регистр, либо 64-разрядная ячейка памяти. 
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раск$$м приемник, источник 
Источник Приемник (ММХ-регистр) 


Приемник ({ММХ-регистр) 
Рис. 10.7. Схема работы команды РАСКЗЭ\ММВ 


„Чата 
мет [6 отеоон 

[Я 00457 теод+ов 
.соде 


раскззию гитхо, пет =: мипхО = 45 7Р 7Р 80 00 00 00 00 


Пример показывает, как выполняется принцип знакового насыщения резуль- 

тата до 7 и 80В. Подобная ситуация возникает каждый раз, когда значение 

в исходном слове превыщает максимально возможное. 

Следующая группа ММХ-команд позволяет выполнить обратную операцию — 
расширить размер элементов операнда в два раза. При этом недостающая полови- 
на вновь формируемого элемента извлекается из второго операнда. 

РУМРСКНВМ! приемник, источник — команда распаковки байтов из старшей поло- 
вины приемника в слова с использованием в качестве старшей половины этих 
слов байтов из источника. Формирование результата происходит посредством 
поочередной выборки байтов из приемника и источника (рис. 10.8). Результат 
помещается в приемник, который является одним из ММХ-регистров. Источ- 
ник — либо ММХ-регистр, либо 64-разрядная ячейка памяти. 


рипрсКЬБм приемник, источник 
Источник 


Приемник (ММХ-регистр) 






Приемник (ММХ-регистр) [ГТГ] 


Рис. 10.8. Схема работы команды РИМРСКНВМ/ 


. Дата 
мет Ом 0 

г 01020304 ЕП 
пет] Фи 0 
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.соде 


оу  питхо. тет : гихо = 01 02 03 04 ГЕ ГР 00 00 
: мет] = 01 0# ОЕ ОЕ ее ее 00 00 
рипрсКИАБи гттх0. тет? —; гттхб0 = 0101 0702 0703 0104 


РИМРСКНМ/О приемник, источник — команда распаковки слов из старшей полови- 
ны приемника в двойные слова с использованием слов из источника в качестве 
старшей половины этих двойных слов. Формирование результата происходит 
путем поочередной выборки слов из приемника и источника (рис. 10.9). Резуль- 
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тат формируется в приемнике, который является одним из ММХ-регистров, 
в то же время источник может быть либо ММХ-регистром, либо 64-разрядной 


ячейкой памяти. 


рипрскима приемник, источник 


Источник Приемник (ММХ-регистр) 


Приемник (ММХ-регистр) 
Рис. 10.9. Схема работы команды РУМРСКНУО 


РУМРСКНРО приемник, источник — команда распаковки двойных слов из старшей 
половины приемника в учетверенные слова с использованием в качестве стар- 
шей половины этих учетверенных слов двойных слов из источника. Формиро- 
вание результата происходит путем поочередной выборки двойных слов из при- 
емника и источника (рис. 10.10). Результат помещается в приемник, который 
является одним из ММХ-регистров. Источник — либо ММХ-регистр, либо 
64-разрядная ячейка памяти. 


рипрсКбад приемник, источник 
Источник Приемник (ММХ-регистр) 


Приемник (ММХ-регистр} 


Рис. 10.10. Схема работы команды РУИМРСКНОС 


Вы, наверное, обратили внимание, что предыдущие три команды работают со 
старшими половинами операндов. Следующие три команды, наоборот, работают с 
их младшими половинами. 

РИМРСКЕВУ приемник, источник — команда распаковки байтов из младшей поло- 
вины приемника в слова с использованием в качестве младшей половины этих 
слов байтов нз источника. Формирование результата осуществляется путем 
поочередной выборки байтов из приемника и источника (рис. 10.11). Резуль- 
тат помещается в приемник, который является одним из ММХ-регистров. Ис- 
точник — ММХ-регистр или 64-разрялная ячейка памяти. 


рипрсК®Ьм приемник, источник 


Источник Приемник (ММХ-регистр) 










Приемник (ММХ-регистр} [ГЕ РТЕГГ] 


Рис. 10.11. Схема работы команды РУМРСКЕВМ 
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мет] [6 ООВ 
Ге ОсОсосбсототИ 


.соде 


поуа гитх0. тет ; ИтхО = ТЕ ТР ее ее 01 02 03 04 
; мет} = 0с 0с 0с 0с 07 0+ 0+ 0: 
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* РОМРСКИМО приемник, источник — команда распаковки слов из младшей полови- 
ны приемника в двойные слова с использованием в качестве их младшей поло- 
вины слов из источника. Формирование результата осуществляется путем по- 
очередной выборки слов из приемника и источника (рис. 10.12). Результат 
помещается в приемник, который является одним из ММХ-регистров, в то же 
время источник может быть либо ММХ-регистром, либо 64-разрядной ячей- 
кой памяти. 


рипрсК\ма приемник, источник 
Источник Приемник (ММХ-регистр) 


Приемник (ММХ-регистр} 
Рис. 10.12. Схема работы команды РИМРСКЕМ/О 


РИМРСКГОЙ приемник, источник — команда распаковки двойных слов из младшей 
половины приемника в учетверенные слова с использованием в качестве млад- 
щей половины этих учетверенных слов двойных слов из источника. Формиро- 
вание результата осуществляется путем поочередной выборки двойных слов 
из приемника и источника (рис. 10.13). Результат помещается в приемник, ко- 
торый является одним из ММХ-регистров. Источник — либо ММХ-регистр, 
либо 64-разрядная ячейка памяти. 


рипрск9а приемник, источник 
Источник Приемник (ММХ-регистр) 










Приемник (ММХ-регистр) 


Рис. 10.13. Схема работы команды РУМРСКГОЯ@ 


Команда очистки стека регистров сопроцессора 


В конце блока команд, содержащего ММХ-инструкции, должна обязательно при- 
сутствовать команда ЕММ$, в функции которой входит очистка стека регистров и 
установка единичных значений в регистре тегов. Каждому регистру стека сопро- 
цессора соответствует двухразрядное поле в этом регистре, единичное значение 
которого говорит о том, что регистр пуст. 

Наличие команды ЕММ$ обязательно, если ММХ-команды комбинируются 
с командами сопроцессора. 
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В настоящее время пока еще достаточно большое количество компьютеров ра- 
ботает на процессорах, не поддерживающих ММХ-технологию. Для того чтобы 
количество пользователей вашей программы было как можно большим, это обсто- 
ятельство необходимо учитывать. Соответственно при разработке программы дол- 
жны предусматриваться альтернативные фрагменты кода, в которых функциони- 
рование ММХ-команд будет эмулироваться с помощью целочисленных команд. 
Перед началом работы такая программа должна выполнять проверку текущего про- 
цессора на возможность поддержки им ММХ-команд, по результатам которой сле- 
дует передавать управление на соответствующий фрагмент кода. На основе чего 
выполняется подобная проверка? 

В систему команд Пие!-процессоров, начиная с последних 486 и Репйит, вхо- 
дит команда СРУТО (см. приложение А учебника), с помощью которой можно полу- 
чить информацию о текущем процессоре. Следующий листинг содержит пример 
прОтраНы: которая определяет факт поддержки процессором ММХ-технологии. 


:| Программа: %е$%_ сри14.азт. Определение факта поддержки 
: процессором ММХ-технологии. 


еее еее еее + 
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моде] и5е16 этаП 
. ЗФаск 100н 
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по_птх пез [6 "Процессор не поддерживает ММХ-технологию". "$" 
соде 
мати ргос ; начало процедуры татп 

оу ах. @дата 

оу 9$. ах 

хог еах. ебх 

оу еах. 1 

срита 

ы ебх. 23 

тс по мтх 

оу ан. 9 

Теа 9х. птх_ тез 

17 21в 

Этр ехт 
по тих: ПУ ап. 9 

Теа Чх. по птх_ тез 

11% 21и 
ех{: оу ах, 400 ; пересылка 4с00Н в регистр ах 

Тиё 21и : вызов прерывания с номером 21Н 
мати епар ; конец процедуры тат 
еп мати ; конец программы с точкой входа татп 


Пример применения ММХ-технологии 


В качестве примера применения ММХ-технологии рассмотрим преобразование 
графического изображения. Как правило, большинство мультимедийных файлов, 
ккоторым можно отнести и графические файлы, представляют собой массивы од- 
нородных элементов. Такому массиву предшествует некоторая описательная ин- 
формация (заголовок), в котором содержится общая информация о файле. Так как 
в подобных массивах размер элементов обычно одинаков, то их удобно обрабаты- 
вать группами. Наибольшая эффективность работы программы достигается, если 
использовать ММХ-команды. 
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В качестве типового мультимедийного файла можно рассматривать файл рас- 
трового изображения. Среди типов файлов, предназначенных для хранения рас- 
тровых изображений, наиболее простую структуру имеют ВМР-файлы. 

На практике часто возникает необходимость преобразования цветного изобра- 
жения в полутоновое. Подобную возможность, в частности, поддерживают многие 
популярные редакторы растровой графики. Попробуем самостоятельно решить эту 
задачу, используя возможности команд ММХ-расширения. 

Структурно файл растрового изображения в формате \т4омз ВМР состоит 
из двух или трех блоков. 


Обязательный заголовок с информацией, характеризующий растровое изобра- 
жение. По отношению к содержащимся в этом заголовке данным его можно 


разделить на две части: 

С первая часть, имеющая размер 14 байтов, предназначена для идентифика- 
ции файла как растрового графического и хранения общей информации 
о нем; 

С вторая часть, имеющая размер 40 байтов, содержит характеристики самого 
растрового изображения. 


Необязательный массив с информацией о цвете. Элементы этого массива пред- 
ставляют собой структуру, состоящую из четырех полей. Размерность каждого 
поля составляет один байт. Три поля этой структуры содержат значения ин- 
тенсивности красного, зеленого и синего цветов (ВСВ-модель цвета), четвер- 
тое поле всегда равно нулю и предназначено для выравнивания начала следую- 
щего элемента на четную границу. Для процессоров архитектуры Ге! это 
означает существенное повышение производительности, так как выравненные 
данные выбираются из памяти быстрее. Более того, это обстоятельство дает 
хорошие предпосылки к эффективному использованию команд ММХ-расши- 
рения, так как данные во время обработки можно группировать. Массив с ин- 
формацией о цвете отсутствует для растровых изображений с 24-разрядным 
представленнем цвета (ТгиеСоюг). В случае с нашей программой мы имеем на 
входе именно такой файл. На выходе мы должны получить файл с полутоно- 
вым изображением, который уже будет содержать подобный массив оттенков. 


Обязательный массив с описанием пикселов растрового изображения. Формат 
элементов этого массива зависит от типа растрового изображения. В нашем 
случае мы имеем два типа растрового изображения: 24-разрядное (ТгиеСоог) 
и 8-разрядное (полутоновое). Как отмечено выше, файл с описанием 24-раз- 
рядного изображения не содержит массива с информацией о цвете. В этом фай- 
ле непосредственно за заголовком (54 байта) следует информация о цвете пик- 
селов. Каждый пиксел описывается тремя байтами, которые содержат значения 
(из диапазона 0-255) интенсивностей красного, зеленого и синего цвета. Для 
других типов изображений информация о цвете каждого пиксела предоставля- 
ется по другому принципу. К примеру, для восьмиразрядного изображения 
(которое мы должны сформировать в нашей задаче) информация о цвете конк- 
ретного пиксела получается следующим образом. Каждый пиксел в массиве 
с описанием пикселов растрового изображения описывается одним байтом. Зна- 
чение этого байта является индексом в массиве с информацией о цвете, рас- 
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смотренном в предыдущем пункте. Соответствующий элемент массива с ин- 
формацией о цвете содержит значения красной, синей и зеленой составляю- 
щих цвета пиксела. 


Рассмотрим суть алгоритма обработки, который реализует программа преобра- 
зования растрового изображения. Ниже приведены фрагменты исходного ВМР- 
файла (24-разрядное изображение) и соответствующего выходного ВМР-файла 
(8-разрядное нолутоновое изображение), сформированного в результате программ- 
ной обработки. 

Для 24-разрядного цветного изображения с адреса 0000:0036 и до конца файла 
(адрес 0008:ОСЕ5) располагается описание пикселов — три последовательных бай- 
та описывают красную, синюю и зеленую составляющие одного пиксела. 


0000:0000 42 40 26 0С 08 00 00 00 00 00 36 00 00 00 28 00 ВМ........ 6...С. 
0000:0010 00 00 ВВ 01 00 00 В8 01 00 00 01 00 18 00 0000 ................ 
0000:0020 00 00 С0 00 08 00 С2 1Е 00 00 С2 1Е 00 00 00 00 ................ 
0000:0030 00 00 00 00 00 00 49 7А Аб 4А 7В А? 40 7Е АА 4Р ...... [2.{.М-.0 
0000:0040 80 АС 50 81 АО 50 81 АО 4Е 80 АС 4Е 80 АС 48 7С Ъ.Р..Р. .0Ъ.0Ъ.К] 


0008:0СЕО АБ 7А 93 АЗ 79 93 АЗ 79 92 Аб 70 99 В1 92 АО СВ .7..у..у..}..... 
0008:0СЕ0 АБ СА Еб С2 Е ЕС... 


Для 8-разрядного полутонового изображения с адреса 0000:0436 и до конца 
файла (адрес 0002:Е875) находится описание пикселов. Каждый байт в этой части 
файла является индексом массива цветовых значений. 


0000:0000 42 40 76 [8 02 00 00 00 00 00 36 04 00 00 28 00 ВМу....... бе: 
0000:0010 00 00 В8 01 00 00 В8 01 00 00 01 00 08 00 0000 ................ 
0000:0020 00 00 40 24 02 00 С2 1Е 00 00 С2 1Е 00 00 0001 ..6............. 
0000:0030 00 00 00 00 00 00 00 00 00 00 01 01 01 00 02 02 ................ 
0000:0040 02 00 03 03 03 00 04 04 04 00 05 05 05 00 06 06 ................ 
0000:0050 06 00 07 07 07 00 08 08 08 00 09 09 09 00 ОА ОА ................ 
0000:0060 ОА 00 ОВ 0В ОВ 00 06 0С 00 00 00 006 00 00 ОЕ ОЕ ................ 
0000:0070 0Е 00 0: ОЕ ОЕ 00 10 10 10 00 11 11 11 00 12 12 ................ 
0000:0080 12 00 13 13 13 00 14 14 14 00 15 15 15 00 16 16................ 
0000:0090 16 00 17 17 17 00 18 18 18 00 19 19 19 00 1АТА ................ 
0000:00А0 1А 00 1В 1В 18 00 1С 1С 1С 00 10 10 10 00ТЕТЕ ................ 
0000:0080 1Е 00 1: ТЕ 1# 00 20 20 20 0021 21 21 00 22 22 ...... „1!!.”" 

0000:00С0 22 00 23 23 23 00 24 24 24 00 25 25 25 00 26 26 ".###.$$$.454.58 


... массив цветовых значений 


0000:0400 Е2 00 Е3 ЕЗ ЕЗ 00 Е4 Е4 Е4 00 25 РБ [5 00 26 Еб ................ 
0000:0410 Е6б 00 7 [7 Е7 00 Е8 [8 ЕВ 00 [9 Г9 Е9 00 РА ГА ................ 
0000:0420 РА 00 ЕВ ЕВ ЕВ 00 ЕС ЕС ЕС 00 ЕО РО ГО 00 ЕЕЕЕ ................ 
0000:0430 ЕЕ 00 ЕР ЕЕ ЕР 00 70 71 74 76 77 77 76 76 7275 ...... раЕМимууги 
0000:0440 78 77 72 69 57 5А 61 62 63 66 69 60 72 74 67 70 хыг1_2абсР1тгЕ9р 
0000:0450 77 77 74 72 70 60 6Е 68 69 6А 6С 6С 68 64 63 6Е имёгрипкя 1 ТВасо 
0000:0460 74 6Р 6Е 76 7А 75 68 73 75 6Е 74 7Е 78 69 76 71 фооухий$иое-х1уа 
0000:0470 6А 68 6С 74 7А ТЕ 86 7В 78 7С 78 6А 67 6Е 69 79 ]т1Е2-. {х| хддту 


0002:Е860 73 71 60 6С 70 74 77 75 75 79 70 7Е 7С 79 8В 80 здттрьмииу}-|У.. 
0002:Е870 8С 8С 93 АТ С4 08 ... 


Программа преобразования 24-разрядного изображения в 8-разрядное выпол- 
нена в виде консольного приложения \ш4о\5. Таким образом, этим примером 
демонстрируется решение двух задач: во-первых, показана практика применения 
возможностей ММХ-технологии обработки данных и, во-вторых, приведен еще 
один пример (см. главу 16 учебника) использования консольных УЛт4о\!з-при- 
ложений в программах на языке ассемблера. 
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Программа преобразования последовательно выполняет следующие действия. 


Ввод имен исходного и выходного файлов. Следует отметить следующее тре- 
бование к исходному файлу. Этот файл должен быть отсканирован с разреше- 
нием не менее 200 4ри, в противном случае возможны искажения. В нашем слу- 
чае борьба за качество не является основной задачей, поэтому для исправления 
возможных искажений в программе не предпринимается никаких действий. 
Если сканерау вас нет, то следует подобрать файл соответствующего качества. 
Если у вас нет ни того ни другого, то среди файлов, прилагаемых к книге, есть 
файл, с которым вы можете проводить необходимые эксперименты. 


Открытие исходного и создание выходного файла. Для работы с этими файла- 
ми используется еще один полезный механизм — отображение файлов на па- 
мять. Этот механизм позволяет открыть файлы специальным образом и рабо- 
тать с ними далее как с обычными массивами. При рассмотрении программы 
обратите внимание на эту возможность и на то, как ею пользоваться в програм- 
мах на языке ассемблера. 


Определение корректности исходного файла. При этом проверяется два обсто- 
ятельства: первое — является ли он ВМР-файлом, и второе — является ли он 
24-разрядным файлом растрового изображения. 


Формирование заголовка выходного файла на основании информации исход- 
ного файла. Основными при этом являются две задачи — определение размера 
выходного файла и заполнение полей, определяющих особенности данного ра- 
стрового файла. 

Формирование массива цветов. Массив содержит 256 элементов, что позволя- 
ет формировать 256-цветное растровое изображение. Файл с 8-разрядным по- 
лутоновым растровым изображением структурно ничем не отличается от 8-раз- 
рядного цветного файла. Единственное отличие можно увидеть при сравнении 
массивов цветов. Для массива 8-разрядного полутонового изображения значе- 
ния красной, зеленой и синей составляющих одинаковы. Для цветных изобра- 
жений подобной закономерности не существует, так как оттенки цветного изоб- 
ражения в модели КСВ являются комбинациями отличающихся значений 
красной, зеленой и синей составляющих. 

Формирование значений пикселов. Как уже упоминалось выше, каждый пик- 
сел описывается одним байтом, который на самом деле является лить индек- 
сом, обозначающим цвет в массиве цветов. 

Закрытие файлов. В конце текста программы необходимо с помощью соответ- 
ствующих функций У шдо\з корректно закрыть файлы, в противном случае 
результаты работы программы будут потеряны. 


Более детально алгоритм преобразования цветного изображения в полутоно- 


вое поясним по ходу рассмотрения текста программы, представленного ниже. При 
этом мы не будем обсуждать функции \пао\, обеспечивающие функциониро- 
вание программы. Такую информацию вы можете почерпнуть из многочисленных 
источников. В частности, программа разработана с использованием упоминавше- 
гося выше механизма отображения файлов на память [10]. Основной акцент будет 
поставлен на ММХ-команды. 
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ИО: ат 

И Е Бао ое а рамен Бур СО О урав + 
Я Программа: рг910.азт. Консольное припожение для И1п32 (с использованием | 
:| команд ММХ-расширения и файлов. проецируемых в память). | 
еее - + 
.486 
„поде] Нас. — УТОСАЧ ; модель памяти Паё 


:ЗТОСАЦ. - передача параметров в стиле С (справа налево) 
; вызываемая процедура чистит за собой стек 


ЖМОТМСЕ. 


1ис1иде ттхЗ2. тис 
тпс1иде итпдоиСопА. тис 
Объявление внешними используемых в данной программе 


ехёгп 


ехёгп 


У$НОВТ 
ит 
ОмО8О 
име 
иМОВО 
ВВУТЕ 
Соога 
хх 


уу 
Соога 


функций ИТп32 (АЗСТТ) 
АПосСопзо1е:РКОС 


иг ЕеСопзо1еА:Р80С 
структура ВМР-файла 


макроопределения типов 


еди 
еди 
еди 
еди 
еди 
еци 


<дм 0> 
<0м 0> 
<99 (> 
<04 0> 
<дм 0> 
<6 0> 


; запрет вывода текста включаемых файлов 


структура для установки положения курсора в консоли 


ЗЕгис 
УУНОВТ 
УУНОВТ 
епд$ 


заголовок ВМР-файла 


НЕМарЕ ПоНоабег 5егис 
ТА 


ЬТуре 
ЬР512е 
ЫТВезегуед1 
ЬЫ1Везегуед2 
ЬОЕЕВ1 1$ 


Ь1$12е 


БыНоп 
ыНе19т 
Ь1РТапез 

БВ СоипЕ 
Ь1Сотргез$1оп 
Ь1512етаде 


ООнОВб 
ИТТ 
ИКТ 
ООМОВО 


ООмОВО 


томе 
[Е 
ОКО 
МОВО 
В) 
оОмО8О 


ЬХРе] $РегМефег 10№ 
Ь1УРе1 $РегМетег 10№ 


Ь1С1г/зед ООмОВС 
С гтрогбайё ООбМОКО 
В1ЕМарЕ11еНеадег еп4$ 
„дата 

Митмг1 99 
1иРТе [еу 
ОЩЕТе 96 

соп Соога 
Ни Е41е да 
ПоибЕе 94а 
БМар?иЕ 1 }е 99 
ИМарои®Е11е 99 
ТИЛетеж 96 
те51 фе 


Теп_пте$1 


бир (20) 
Чир (20) 


; символы "В" и "М" 

; размер файла в байтах 

; резерв 

; резерв 

; смещение в байтах к началу растрового 
; изображения 

: характеристики растрового изображения: 
; размер данной структуры в байтах 

: (должно быть равно 000000288) 

; ширина изображения в пикселах 

; высота изображения в пикселах 

: число цветовых плоскостей (должно быть 1) 
; битов на пиксел (1. 4. 8, 24) 

; метод сжатия 

: размер собственно данных в байтах 

: разрешение по горизонтали в пикселах/м 
; разрешение по вертикали в пикселах/м 

: число цветов в изображении 

: число важных цветов изображения 


'ММХ-преобразование ВМР-файла". 0 
‘Введите путь к исходному файлу ТгиеСо1Тог: * 


= $ - пе51 





тез2 
пе$Егг1 
мезЕгг2 
тезКет 
90 


ОТп 
рогод 


Кароь1 


рухб1ае.ом 


рах$1ген 
18 


ош 1е517е 


тАтеВММХо 
ТИЕАММХ1 


Ро1пЕ0иЕКед1 оп 
РотпЕ1пКед1оп 


пигВубе 
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[69 ’Введите путь к выходному файлу: ’ 
1еп_тме$2 = $ - тез2 

ЧБ 'Это не ВМР-файл* 

Теп тезЕгг1 = $ - мезЕгг1 

ЧБ "Это не ТгиеСоТог-формат' 

Теп_пезЕгг2 = $ - тезЁгг2 

06 "Нажмите любую клавишу для выхода’ 
Теп_мезВее = $ - мезВе 


[е 0 

[9 0 
Табе! ога 
Чи 00008 
бы о049н 
[р 0097Н 
ан 001сп : 00 77 151 28 
[ее 0 

99 0 

да 0 

да 0 

09 8 

ва 0 


Табе]  дмога 
96 00. 00. 00. 00. 01. 01. 01. 00 
]Ла6е!]  дмога 
[в ты 02, 02. 00. 02. 02, 02. 00 


99 

99 0 

94 0 

[#9 "В" 

ргосе  пеаг : точка входа в программу 


запрос консоли 
са11 АПосСопзо1е 

Те5 @ах. еах 

Ку. ех1{ ; неудача 

текст окна заголовка 

риз$Н оРР5её ТТ етеж 

са11 ЗеЕСопзо1етт{1еА 

вывод строки текста: 

вначале получим дескрипторы ввода и вывода консоли 
ризН 570 _ОУТРУТ НАМОЕЕ 

са11 — бебаНапаТе 

оу 90%. вах : дескриптор ввода-вывода консоли 
ризи  УТО ПМРИУТ НАКОЕЕ 

са11 беезЕаНап Пе 


ЮУ Ат. еах ; дескриптор ввода-вывода консоли 
установим курсор в позицию (2. 5) 

ОУ соп.хх. 

ей соп.уу. 5 

ризП соп 

рип. 90 


са11 Зе{СопзоТебиг$огРо$ 1 оп 
тез еах. еах 


в ех1{ ; если неуспех 
вывести приглашение на ввод имени исходного файла 
ри$И 0 


ри$В ОРР5ее Митигл 

ри$В Теп_тез1 

ризй ОТЕ5еЁ пе$1 

ри$В 90% 

са11 ИгтееСопзоТеА 

установим курсор в позицию (2. 6) 
оу соп.хх. 

ОУ соп.уу. 6 

ризП соп 
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рип 90% 

са11 Зе Сопзо1еСигогРо$ 11 0п 

1е5 еах. еах 

Я ех{ ; если неудача 
ризИ 0 

ризп ОРРзеё Милмг1 

рип 80 

ризИ оРР5её "Ее 

рип Ч]1п 

са11 ВеаЧСопзо1еА 

Теа еах. 1иЕ11е 

5иЬ №Митиг1. 2 

ада еах. Митиг1 

|) [еах]. Буе рёг 0 

установим курсор в позицию (2. 7) 

поу соп.хх. 

оу соп.уу. 7 

ризп соп 

ри$Н 90% 

са11 еСоп$о1еСигогРо$1{10п 

фе5 еах. еах 

му. ех1Е ; если неуспех 
вывести приглашение на ввод имени выходного файла 
ризИ Е ы 
ри$И ОРР5еЕ Милмг1 

рип — 1еп_тез2 

рии оРР5еф тез2 

ри$Н 90% 

са11 иг1феСопзо1еА 

установим курсор в позицию (2. 8) 

[в соп.хх. 2 

|) соп.уу. 8 

рии соп 

ризН 90% 

са11 ЗеЁСопзо1еСигзогРо$11оп 

те${ еах. еах 

32 ех14 ; если неуспех 
ризй 0 

ри$Н ОТРзеё Мите 

ризН 80 

рип оРРзеё омЕР Ле 

рип ЧТп 

са11 ВеаЧСоп5о1еА 

Теа еах. ощЕ11е 

$4Ь Митигт. 2 

ада еах. Мипиг1 

е)" [еах]. Бе рг 0 


рии 
ризи 
рип 
ризй 
ризН 
ри$Н 


рии 
са11 
стр 
3е 
поу 


открытие объекта ядра "файл" для исходного файла 1иЕ11е 
м 


ЕЛЕ АТТАТВИТЕ_МОВМАЕ 
ОРЕМАНМАУ$ 
ми 


0 

СЕМЕКТС_ВЕАО+СЕМЕВТС МЕТЕ :; разрешить чтение 
: и запись в файл 

обе 1"+РЛе 

СгеафеЕ11еА 

еах. ОРЕРЕРЕЕЕИ 

ех\{ ; неудача 

ние. еах 


создание объекта ядра “проецируемый файл" 
для исходного файла 1"Р1е 


рии 
ризи 


МЕ 
0 : размер файла текущий 
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ризИ 0 
ризИ РАСЕ_ВЕАСИАТТЕ 
ризИ МЕ 


рип миярПе 

са11 СгеатеЕ 1 1еМарртидА 

те еах. еах 

Я ех1Е ; неудача 

оу АМартиЕ11е. еах 

проецирование файловых данных для исходного файла 

тире на адресное пространство процесса 

рип МЕ 

ри$Н 0 ; смещение первого считываемого 
; байта в файле 

ризп 0 

ризН ЕТЕЕ МАР МЕТЕ 

ризп — ИМартиЕ1Те 

са11 Мар\лемОГЕ11е 

Те$Е еах. еах 


$2 ех1{ ; неудача 

ет Рот ТпКеотоп. еах 

то ли мы прочитали? 

оу ефх. еах ; адрес начала исходного файла в памяти 
стр [ебх] .61512е. 28Н 

Зте ех1{_егг] ; это не ВМР-файл 

стр [ебх].Б1В1СоипЕ. 1ВИ 

дпе ех11_егг2 ; это не ТгиеСоТог-формат 


преобразование Тгие -> бгау 
открытие объекта ядра “файл” для выходного файла оиЕ11е 
ри$В ме 
ризН ЕТЕЕ_АТТЕТВУТЕ_МОВМАЕ 
ризН ОРЕМ АЕМАУ$ 
рип м 
рип 0 
ризН СЕМЕКТС ВЕАО+СЕМЕВТС МЕТТЕ : разрешить чтение 
: и запись в файл 

ризИ оРР5её ощЕПе 
са11 СгеатеР11еА 
стр еах. ОРЕЕЕЕРЕТ 
де ехз{ ; неудача 
оу НощЕ11е. еах 
создание объекта ядра “проецируемый файл” 
для выходного файла оц Ее. 
вычисляем размер выходного файла ТгиеСо]ог в пикселах 
(умножаем длину изображения на его высоту (в пикселах)) 
оу еах. [е5х1.Б1итаЕй 
пы] Чмога р&г [ебх].Б1Нет9ве 
оу р1х$12еЁ ом. еах ; размер растра в пикселах (младший) 
оу р1х$12еН1. ефх ; размер растра в пикселах (старший) 
в.еах размер собственно растрового изображения в байтах 
ада еах. 54 +4* 256 ; 54 - размер заголовка 

; 4 * 256 - массив цветовых значений 
поу оифЕ11е512е, еах 


ризН МЕ 

рии еах : размер выходного файла в байтах 
рип МЕ 

риз$Н РАбЕ_КЕАОМЕТТЕ : РАСЕ ИВТТЕСОРУ 

ризН м 


рии Но 1е 

са11 СгеафеР11еМарр1пдА 

фе5{ еах. еах 

Аа ех1Е : неудача 

поу ИМароц%Е11е. еах 

проецирование файловых ланных для выходного файла 
ОИТЕ1Те на адресное пространство процесса 

ри$в ОЩЕ11е$17е 
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ризН 0 ; смещение первого считываемого байта 
рии 0 

ризп.  ЕШЕ МАР ИМТЕ ; ЕТеМарАПАссез$ 

рип НМароиЕЕ11е 

са11 Мар\те\ОТЕ1е 

те$Е еах. еах 


Ку. ех1{ ; неудача 
оу РотпЕОи{Ведтоп. еах 
оу ет. еах ; адрес начала выходного файла в памяти 


Представленными в этом листинге действиями мы подготовили приложение 
к выполнению собственно преобразования. Для этого средствами Ми о\’з для ра- 
боты с консолью были введены имена файлов. Затем эти файлы были открыты как 
файлы, отображаемые на память. Адреса файлов в памяти были помещены в ячей- 
ки Ром пВестоп и РотпЕОиКедтоп. Для удобства работы эти адреса были продубли- 
рованы также в регистрах ЕВХ и ЕВ! соответственно. Для того чтобы иметь возмож- 
ность просматривать выходной файл стандартными средствами (графическим 
редактором Раш), необходимо сформировать корректный заголовок для выход- 
ного файла. При этом следует обратить внимание на формирование полей, харак- 
теризующих общий размер файла и размер собственно растрового изображения. 
Методика здесь простая. Из заголовка исходного файла извлекаются значения 
высоты и ширины растра в пикселах. Их произведение и дает размер всего растра 
в пикселах. Для 8-разрядного изображения это значение представляет собой дли- 
ну растра в байтах. Для получения размера всего файла остается прибавить размер 
массива цветов (256 х 4 байта) и размер заголовка ВМР-файла (54 байта). Эти дей- 
ствия мы выполняли, когда создавали выходной файл и определяли его размер. 
Их результат мы будем использовать ниже для формирования соответствующих 
полей заголовка. Рассмотрим продолжение листинга. 


ЕН о формируем заголовок выходного файла 
оу ах. [ебх].БТТуре 
оу [е91].Б1Туре. ах 
пом еах. оиёР11е$1те 
оу [е@11.51512е. еах : общий размер файла 
ОУ [е91].5ТВезегуей1. 0 
пом [е91].5ТВезегуед2. 0 
оу [е41].БРОЕГВ1{$. 54 +4 * 256 
оу [е911.61512е. 28Н 
пом еах. [ебх].Б1\лаи 


ет [ед1].Б1\л И. еах : ширина растра в пикселах 
е) еах. [ебх].Б1Нел9не 
оу [еа11].Б1Нет9пф. еах : высота растра в пикселах 
оу [е91].Ь1Р1апез. 1 : число цветовых плоскостей 
оу [е91] .Б1В1ЕСоите. 8 : число битов на пиксел 
пом [ед] .51Сотрге$$1оп. 0 ; метод сжатия 
ей еах. оиЕ11е51те 
$6 еах. 54 +4* 256 
оу [е41] .61517е1таде. еах ; размер собственно 
:; растрового изображения 
оу еах. [ебх] .Б1ХРе]РегМефег 
пом [е41] .51ХРе] $РегМейег. еах ; ширина растра в пикселах 
пом еах. [ебх].Ь1УРе] РегМекег 
оу [е41] .1УРе] $РегМейег. еах : высота растра в пикселах 
оу [еа1].651С1гзеа, 100Н :; число цветов в изображении 


оу [еа1].51С1гтрогфапе. 0; 
Далее формируем массив цветов. Особенности его содержимого мы обсуждали 
выше. Теперь нас интересует специфика процесса его формирования. Каждый эле- 
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мент этого массива занимает 4 байта, поэтому для его заполнения удобно использо- 
вать ММХ-команды. Суть исполняемых действий очень проста, поэтому попробуй- 
те разобраться в них самостоятельно, обращаясь для справки к описанию команд 
ММХ-расширения, приведенных в тексте этой главы (см. выше подраздел «Система 
команд») и в приложении А учебника. Рассмотрим продолжение листинга. 


у-----* формируем массив цветов 
ада ед1. 54 
оу есх. 128 
ПЮУД гттхО. ти1ЕВММХО 
ПОУЧ гттх]. титЕВММХ} 


хог е51. е51 
03: поуЧ [е91+е$1*8]. гиитхо 
радди$Ь гттхб. гтих1 
77с е51 
дес есх 
и. 3 


После формирования массива цветов все готово для выполнения собственно 
преобразования растрового изображения. Оно выполняется по определенному 
алгоритму, суть которого заключается в следующем. Каждому пикселу цветного 
изображения сопоставляется эквивалентный оттенок серого цвета. Для получе- 
ния такого оттенка необходимо красную, синюю и зеленую составляющие цвета 
исходного пиксела умножить на определенные коэффициенты, после чего сложить. 
Полученный результат делится на 256 (это удобно делать сдвигом на 8 разрядов 
вправо). Частное от деления (размером в один байт) и является нужной градацией 
серого цвета, полученным из СВ-составляющих исходного цветного пиксела. Схе- 
матично процесс преобразования цвета пиксела показан на рис. 10.14. 

Исходный 


файл 
(ТгиеСоюг) 





Выходной 
файл 
{8-битовов 
изображение) 





[Заголовок_] _Массив цветов  |--- -- --` Р- | Ру ----- [П] 
ЕЕ ВИ 
54 байта (256*4) байтов 1 байт 


Рис. 10.14. Схема преобразования цветного пиксела (ТгиеСо/ог) в эквивалентный серый 


ЕЕ: позиционирование в выходном файле 


оу есх. рахблхе ом 
ада еф1. 4 * 256 : [е91] - на начало собственно 
; растрового изображения 

в выходном файле 
ада ебх. [ебх + 0ан] 
дес ебх 
хог е51. е51 

нЕ аааЕ загрузка в регистры цветовых значений для преобразования 


адрес в файле начала изображения - 1 
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м2: рипрсК1Ьм гтих0. [ебх)[е51*4] 
рзгм  гитхо. 8 
рти11м глтхО, рогод 
ПОУЗ гих]. гиитхо 
р$114  гиих!. 16 
раддизи гттх0. гттх1 
р$114  гттх1. 16 
раадизм гттх0. гттх1 
р$г1м гих. 8 : делим на 256 
поуд  КаБоБТ. гттхо 
поу а1. Буфе рег Кабо + 6 





МОУ [е91]. а1 
ада ебх, 3 
тис ед 

дес есх 

Зи м2. 

тр ех1ф 


В данном варианте программы обрабатываются только две ошибочные ситуа- 
ции: ввод некорректного имени файла (или пути к нему) и выбор в качестве ис- 
ходного файла с типом, отличным от ТгиеСоюог. В случае возникновения других 
ошибок производится переход на метку ехН с последующим выходом из про- 
граммы. 

------ установим курсор в позицию (5. 10) 


ех1{_егг1: оу соп.хх. 5 
пом соп.уу. 10 
ризп сой 
рип 90% 


са11 Зе{Сопзо1еСигзогРо$1Е1оп 
фе5е еах. еах 


$2 ех1+ :; если неуспех 
;------ вывести сообщение об ошибке 
рии 0 


ризп ОРР5её Митиг1 
ри$В 1еп_тез2 
рии оТ15её мезЕгг1 


ри$Н 90ие 

са11 иг сеСопо1еА 

Эр ех1{ ; гебигп 
+= установим курсор в позицию (5. 10) 

ех1Е_егг2: [в соп.хх, 5 

ОУ соп.уу. 10 

ризП соп 

рип 90иЕ 

са11 Зе Соп$о1еСигзогРо$ {оп - 

тез еах. еах 

Ау. ех1{ ; если неуспех 
;------ вывести сообщение об ошибке 

рип 0 


рип ОТЕ5её Митиг1 
рип Теп_тез2 
ризп оТГ5еЕ мезЕгг2 
ризи 90 
са11 Игттебопзо1еА 
тр гебигп 

1------ закрываем файлы 


ех1{: етт5 
у------ установим курсор в позицию (5. 12) 
оу соп.хх. 5 
по соп.уу. 10 
ризП соп 
ризВ 90ие 


са] ЗефСопзо1еСигзогРо$ 1 Топ 
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вывести сообщение о нажатии любой клавиши 
ризН 

ри$Н ОЕРсеф Митиг1 

рип  1еп мезКее 

ри$й оТГ5её мезКеЕ 


рип 90ие 

са} 1 иг ебопзо1еА 
рип 0 

ризН ОРЕзеё Митиг1 
ризВ 80 

ри$Н оРт$её 17 Пе 
ризИ От 





са11 КеадСопзоТеА 

Перед выходом из программы необходимо подобающим образом закрыть фай- 
лы. Если этого не сделать, то их содержимое не изменится. Для корректного за- 
крытия файла, спроецированного на память, следует вызвать функции Ви$Н- 
МемОЕРИе и СюзеНап(е. С помощью функции Ни$Н\емОЕЕе измененные данные из 
памяти копируются на диск. Функция (ю5еНапе вызывается дважды для закры- 
тия объектов ядра «файл» и «проецируемый файл». 


рип м 

ризН Роли ТпКед1оп 

са11 Ни Лено ТЕ Ле 

ризН И7лЕ]е 

са11 СЛозеНате 

ризп — ИМартиЕ Те 

са1т СТозеНап Ле 

ризН ош] е51ге 

ризН Рози Ои{Ведлоп 

са11 Низн\УтеотЕ Ле 

рии НощЕПе 

са1] СозеНапе 

рии ИМарощЕ1е 

са11 СТозеНап Ле 
1------ выход из приложения 
14---- готовим вызов МОТО Ехт&Ргосе$$ (ИМТ ичЕХЯСоде) 


геигп: ризй 0 

са11 Ех1ЕРгосе$$ 
эбагЕ епар 
епа $фагЕ 


Дополнительные целочисленные ММХ-команды 


Представленные здесь команды нужно рассматривать как дополнение к системе 

целочисленных ММХ-команд. Впервые они появились в архитектуре процессора 

Репнит Ш. Общее их количество — 12. 

® РАМСВ | РАУбМ! приемник, источник — команды вычисления среднего двух значе- 
ний. Значения представляют собой беззнаковые целочисленные упакованные 
элементы операндов приемник и источник размером байт/слово. Источник мо- 
жет быть ММХ-регистром или 64-разрядной ячейкой памяти, и его содержи- 
мое не изменяется. Изменяется только значение приемника, который должен 
быть ММХ-регистром. В нем формируется результат вычисления среднего 
арифметического. Сама операция выполняется над парными элементами в обоих 
операндах следующим образом: 
1) выполнить беззнаковое сложение парных элементов операндов приемника 

и источника; 
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2) запомнить перенос в старшие разряды; 


3) сдвинуть вправо на один разряд результат сложения (без учета бита перено- 
са), то есть разделить на 2; 


4) результат сдвига сложить со значением переноса. 


Дополнительные ММХ-команды придают ММХ-расширению ряд новых воз- 
можностей для организации более эффективной обработки данных. Так, сле- 
дующие команды позволяют организовать доступ к отдельным элементам 
ММХ-операнда. 

РЕХТЕМ! приемник, источник, маска — команда извлечения одного из четырех упа- 
кованных слов операнда источник. Источник должен быть ММХ-регистром. 
Каждое выбираемое слово локализуется с помощью значения, задаваемого мас- 
кой. Актуальность в ней имеют два младших бита, которые численно определя- 
ют номер слова (от 0 до 3), извлекаемого из источника. Это слово помещается 
в младшее слово приемника, являющегося одним из 32-разрядных регистров 
общего назначения. Старшее слово приемника обнуляется. 


” РИМ$ЕМ приемник, источник, маска — команда вставки слова в одно из четырех 
упакованных слов операнда приемник. Приемник должен быть ММХ-регист- 
ром. Источник может быть 32-разрядным регистром общего назначения или 
словом в памяти. Место вставки локализуется в приемнике с помощью значе- 
ния, задаваемого маской. В ней значимы два младших бита, которые численно 
определяют номер слова (от 0 до 3) в приемнике, замещаемого новым значени- 
ем из источника. Если источник — 32-разрядный регистр, то вставляемое из 
него слово должно быть младшим. 


РМАХОВ | РМАХ$М! приемник, источник — команды извлечения максимального зна- 
чения из каждой пары упакованных элементов в операндах. Элементы пред- 
ставляют собой беззнаковые байты (для команды РМАХОВ) или знаковые слова 
(для команды РМАХ$М). Приемник должен быть ММХ-регистром. Источник 
может быть ММХ-регистром или 64-разрядной ячейкой памяти. Результат из 
максимальных элементов каждой пары формируется в операнде приемник. 


РМТМОВ | РМ1М$М! приемник, источник — команды для извлечения минимального 
значения из каждой пары упакованных элементов в операндах. Элементы пред- 
ставляют собой беззнаковые байты (для команды РМТМЫВ) или знаковые слова 
{для команды РМ1М$М/). Приемник должен быть ММХ-регистром. Источник 
может быть ММХ-регистром или 64-разрядной ячейкой памяти. Результат из 
минимальных элементов каждой пары формируется в операнде приемник. 


Следующая команда необычная — она позволяет выделитьзначения знака (стар- 
шего бита) упакованных байтовых элементов, после чего эти биты собираются 
в один байт и помещаются в младшие разряды регистра общего назначения. 
Подобная операция позволяет выполнять анализ знаков упакованных байтов 
в ММХ-регистре и организовывать ветвление программы. 

РМОУМЗКВ приемник, источник — команда для формирования байтового значе- 
ния, биты которого являются знаковыми для всех восьми байтов, упакованных 
в ММХ-регистре. Источник должен быть ММХ-регистром. Результат из ми- 
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нимальных элементов каждой пары формируется в операнде приемник. Прием- 
ник является 32-разрядным регистром общего назначения (формируемый из 
знаковых разрядов байт будет являться младшим). 


® РМИЁНИМ приемник, источник — команда умножения упакованных беззнаковых 
слов с выдачей в качестве результата старших слов произведения. Источник 
может быть ММХ-регистром или 64-разрядной ячейкой памяти. Результат из 
старших слов произведения каждой пары формируется в операнде приемник. 
Приемник является ММХ-регистром. Ранее мы уже рассматривали подобную 
команду — РМИЁНИ, которая также работала со словами, но с учетом знака. 


РЗАОВМ! приемник, источник — команда вычисления суммарной разницы значе- 
ний каждой пары беззнаковых байтов упакованных байтовых значений в при- 
емнике и источнике. Источник может быть ММХ-регистром или 64-разрядной 
ячейкой памяти. Результат из старших слов произведения каждой пары фор- 
мируется в операнде приемник. Приемник является ММХ-регистром. Понима- 
ние алгоритма работы этой команды вызывает определенные трудности. По- 
этому рассмотрим его более детально: 


1) для каждой пары байтовых элементов операндов приемник и источник вы- 
числить модуль их разности; 


2) сложить модули разности всех пар байтовых элементов и записать получен- 
ный результат в младшее слово приемника; 


3) старшие три слова приемника обнулить. 


&# РЪНУРМ приемник, источник, маска — команда перераспределяет упакованные сло- 
ва из операнда источник в операнд приемник в соответствии с маской, заданной 
операндом маска. Источник может быть ММХ-регистром или 64-разрядной 
ячейкой памяти. Результат перераспределения слов второго операнда помеща- 
ется в приемник, который является ММХ-регистром. Исходное содержимое 
приемника не принципиально. Маска представляет собой байт, в котором чис- 
ленные значения номеров битов (0-7) определяют, какое из четырех слов ис- 
точника необходимо разместить в соответствующих байтах (0-7) приемника 
(Он0О, 1и1 ит. д.). 

Например, если источник имеет значение 0012 950Ъ 0054 0#45 и задана маска 
01101101Ъ, то после применения команды Р$НУР\ в приемнике окажется зна- 
чение 0054 950 0012 0054. 


ХММ-расширение архитектуры 
процессора Репйит 


В 1999 году семейство процессоров Репйит фирмы Пие]| пополнилось новой мо- 
делью — процессором Репиит П]. Основу его архитектуры составляет ядро про- 
цессора Репиит П, дополненное модулем $5Е (Зёгеапта ПМР Ежепзюп$ — 
потоковое $1МО-расширение). Потоковое $1МО-расширение дополняет ММХ- 
технологию средствами обработки данных с плавающей запятой. Выше мы усло- 
вились называть этот тип ММХ-расширения ХММ-расширением. 
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ХММ-расширение является продолжением политики Ние| на ввод в архитек- 
туру процессоров средств, повышающих эффективность вычислений на больших 
массивах однотипных данных. Программно-аппаратная модель ХММ-расширения 
имеет простую и гибкую структуру. В нее входит ряд новых регистров, новые ко- 
манды и форматы данных. Программы, разработанные для ранних моделей про- 
цессоров, будут также выполняться на компьютерах, оснащенных процессором 
Репиит Ш, но они не смогут задействовать новшества, введенные ХММ-расши- 
рением. Для этого программа должна быть изначально написана с учетом логики 
работы программно-аппаратных средств, входящих в ХММ-расширение. 


Модель ХММ-расширения 


ХММ-расширение добавляет следующие новые элементы в архитектуру процес- 
сора: 
восемь 128-разрядных регистров с плавающей запятой — хтто ...хтт7 (ХММ- 
регистры); 
формат данных (формат ХММ) размером 128 битов, представляющий собой 
совокупность из четырех упакованных 32-разрядных чисел с плавающей запя- 
той в коротком формате — ЗРЕР (Зтяе Ргес1яоп Ноайпё Ро!п®); 
” набор ХММ-команд; 
* 32-разрядный регистр управления/состояния. 
Рассмотрим их подробнее. 
На рис. 10.15 показаны восемь 128-разрядных ХММ-регистров для.хранения 
данных и один регистр управления/состояния. Каждый из этих регистров досту- 
пен соответствующими командами ХММ-расширения. 


Регистры данных 


хто 
хтй1 
хтт2. 
хтт3 
хтт4 
хип 5 
хглтб 
хтт7 


ППХС$Р 





31 15 10 
Рис. 10.15. ХММ-регистры 


ХММ-регистры применяются только для хранения данных. Не имеет смысла 
задействовать их для хранения адресов памяти — для этого достаточно регистров 
общего назначения. При написании программы программист может смешивать 
команды обоих типов ММХ-расширения, так как они используют физически раз- 
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ные наборы регистров. Вследствие этого для работы с ними не нужны команды, 
подобные ЕММ5. 

Основной тип данных ХММ-расширения — число с плавающей запятой в ко- 
ротком формате. Операндом ХММ-команды является ХММ-регистр или 128-раз- 
рядная ячейка памяти. Операнд содержит четыре числа с плавающей запятой 
в коротком формате. Поэтому говорят, что числа упакованы, и, соответственно, 
формат данных называется упакованным форматом с плавающей запятой (форма- 
том ХММ). В главе 17 учебника рассмотрены различные форматы данных сопроцес- 
сора, и указанный формат — один из них. Напомню основные его характеристики: 


длина числа < 32 бита; 

длины полей в формате: мантиссы — 24 бита, порядка — 7 битов, знака — 1 бит; 
диапазон значений: 

О двоичное числа — 2—126._2127, 

О десятичное числа — 1,18 х 10-38... 1/70 х 1038. 


Формат ХММ-регистров или 128-разрядной ячейки памяти отражает структу- 
ру формата ХММ. Числа в упакованном коротком формате с плавающей запятой 
в пределах этих объектов нумеруются от 0 до 3. Описание данных формата ХММ 
в программе на языке ассемблера производится по тем же принципам, которыми 
мы руководствовались при описании данных целочисленного ММХ-расширения. 
В памяти данные в формате ХММ располагаются в соответствии с обычным для 
архитектуры Пие! порядком — «младший байт по младшему адресу» (рис. 10.16). 


127 96 95 64 63 32 31 [о] 





[3132 { 6364 195%] 1 
Г) о в о Ея 
<—— Оперативная память —» 281 


Рис. 10.16. Схема расположения в памяти данных формата ХММ 


Назначение регистра управления/состояния МХС$К аналогично соответствую- 
щим регистрам сопроцессора С\!К и $\К (см. главу 17 учебника). Так, большая часть 
битов этого регистра используется для маскирования/демаскирования исключе- 
ний, другая часть — для установки способов округления, просмотра флагов состо- 
яния (табл. 10.8). Работа с этим регистром осуществляется с помощью команд 
ЕОМХС$К и ЕХК$ТОК (загрузка содержимым из памяти) и $ТМХС$В и ЕХЗА\Е (сохране- 
ние содержимого в памяти). 


Таблица 10.8. Назначение битов регистра глхсэг 


0-5 ТЕ, БЕ, ЙЕ, Фиксация исключений с плавающей запятой (см. главу 17 
ОЕ, ЧЕ, РЕ учебника). Для очистки этих битов предназначена команда 
ГОМХСЗК. Возникающие исключения фиксируются для 
всего упакованного формата, и средств для определения 
конкретного числа (из четырех), вызвавшего исключение, 
не существуст 
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Таблица 10.8 (продолжение) 


[вить [Название [назннаие 


1М, ОМ, 7М, | Маскирование определенных типов исключений с плавающей 

ОМ, ОМ, РМ | запятой (см. главу 17 учебника). Начальное состояние этих 
битов единичное, что означает маскирование всех исключений. 
Для установки битов используется команда [ГОМХСЗВ. 
Маскирование исключений действует для всего упакованного 
формата 


КС (Коипатве | Задание режима округления. По умолчанию действует режим 
Сопёго|) округления к ближайшему представимому значению числа 
в коротком формате с плавающей запятой. При желании 
можно установить следующие режимы округления: 
00 — округление к ближайшему; 01 — округление в меньшую 
сторону; 10 — округление в большую сторону; 11 — округление 
к нулю с усечением, то есть отбрасыванием дробной части 


ЕЯ (Ешз|- Установка режима «сдвиг к нулю». Используется в ситуации 
10-Дего) переполнения следующим образом: возвращается нулевое 
значение вместе с истинным знаком результата; 
устанавливаются биты ОЕ и РЕ в регистре МХС$В. 
По умолчанию бит ЕЙ. сброшен в 0. Наличие бита Е7 
не соответствует стандарту 1ЕЕЕ-754 на вычисления 
с плавающей запятой, так как этот стандарт требует при 
возникновении переполнения формировать 
денормализованный операнд. Данный режим введен 
из соображений эффективности. Ценой небольшой потери 
точности можно достигнуть более быстрой работы 
приложений, для которых ситуация переполнения обычна 
(так как не требуется вызова обработчика исключения). 
Демаскирование бита (Е имеет приоритет перед режимом ЕЙ. 





Остальные биты регистра МХС$К (биты 6 и 16-31) зарезервированы (равны 0). 
При попытке записать ненулевое значение в эти биты будет возбуждено исключе- 
ние общей защиты. 


Система команд 


ХММ-расширение процессора Репйит Ш дополнительно вводит в систему команд 
ГА-32 70 новых машинных инструкций (рис. 10.17). Процессор РепЧит 4 дополняет 
систему команд [А-32 еще 144 новыми командами. В основном это команды ХММ-и 
ММХ-расширений. Из-за большого их количества в данном разделе ограничимся 
рассмотрением команд ХММ-расширения РепНит Ш. Этого достаточно для иллюс- 
трации принципов и идей, заложенных в ХММ-расширение. Информацию о ХММ- 
командах РепЧит 4 можно получить из приложения А учебника. 


Команды перемещения данных 
Ниже перечислены команды перемещения данных. 


* МОМАР$ приемник, источник — пересылка выравненных 128 битов из источника в 
приемник. Один из операндов (любой) — ХММ-регистр. Другой операнд должен 
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Команды ХММ-расширения 
Преобразования РЕ 
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Рис. 10.17. Классификация команд ХММ-расширения Репйит 1 


быть ХММ-регистром или 128-разрядной ячейкой памяти. Адрес 128-разряд- 
ной ячейки памяти должен быть выравнен по 16-разрядной границе, иначе про- 
изойдет исключение общей защиты. 


МОУУР5 приемник, источник — пересылка не выравненных 128 битов из источни- 
ка в приемник. Один из операндов (любой) — ХММ-регистр. Другой операнд 
должен быть ХММ-регистром или 128-разрядной ячейкой памяти. В отличие 
от команды МОМАРЗ, данная команда не требует выравнивания по 16-разрядной 
границе адреса 128-разрядной ячейки памяти. 


МОУНР5$ приемник, источник — пересылка не выравненных 64 битов из источника 
в приемник. Один из операндов, но не оба одновременно, должен быть ХММ- 
регистром. Другой операнд — 64-разрядная ячейка памяти. Если пересылка 
производится из памяти, то 64 бита помещаются в старшие 64 бита ХММ-ре- 
гистра, если пересылка производится из регистра, это старшие 64 бита ХММ- 
регистра. Младшие 64 бита ХММ-регистра не изменяются. Данная команда не 
требует выравнивания по 16-разрядной границе адреса 64-разрядной ячейки 
памяти. 

МОУНЕР$ приемник, источник — пересылка 64 битов из источника в приемник. Оба 
операнда должны быть ХММ-регистрами. В результате работы команды изме- 
няется только содержимое младших 64 битов приемника в соответствии со схе- 
мой рис. 10.18. 


» МОМЕНР$ приемник, источник — пересылка 64 битов из источника в приемник. Оба 
операнда должны быть ХММ-регистрами. В результате работы команды изме- 
няются только содержимое старших 64 битов приемника в соответствии со схе- 
мой рис. 10.19. 
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то\р$ приемник, источник 
Источник (ХММ-регистр) Приемник (ХММ-регистр) 





Приемник (ХММ-регистр) 
Рис. 10.18. Схема работы команды МОУНЕР$ 


томНрз приемник, источник 


Источник (ХММ-регистр) Приемник (ХММ-регистр) 
[п3 пе | п1 120 | 





Приемник (ХММ-регистр) 
Рис. 10.19. Схема работы команды МОМЕНР$ 





МОМТЕР5$ приемник, источник — пересылка не выравненных 64 битов из источника. 
в приемник. Один из операндов (любой) — ХММ-регистр. Другой операнд дол- 
жен быть 64-разрядной ячейкой памяти. Если пересылка производится из па- 
мяти, то 64 бита помещаются в младшие 64 бита ХММ-регистра. Если источ- 
ник — регистр, то пересылке подлежат младшие 64 бита регистра. Старшие 
64 бита ХММ-регистра не изменяются. Данная команда не требует выравнива- 
ния по 16-разрядной границе адреса 64-разрядной ячейки памяти. 

МОУМ$КР5$ приемник, источник — пересылка знакового бита каждого из четырех 
упакованных чисел с плавающей запятой источника в младшие четыре бита 
приемника (рис. 10.20). Источник должен быть ХММ-регистром. Приемник 
должен быть 32-разрядным регистром общего назначения. В дальнейшем по- 
лученную четырехразрядную величину можно использовать для организации 
условных переходов. 


то\узКрз приемник, источник 
Источник (ХММ-регистр) Приемник (г32) 





31 23 145 7 0 
Рис. 10.20. Схема работы команды МОУМЗКР$ 


МО\55 приемник, источник — пересылка 32 младших битов из источника в прием- 
ник. Один изоперандов или все операнды должны быть ХММ-регистрами. Если 
ХММ-регистром является только один из операндов, другой операнд должен 
быть 32-разрядной ячейкой памяти. Если пересылка производится из памяти, 
то 32 бита помещаются в младшие 32 бита ХММ-регистра. Если источник — 
регистр, то пересылке подлежат младшие 32 бита регистра ХММ. Остальные 
биты ХММ-регистра не изменяются. 


ХММ-расширение архитектуры процессора Репиит — 375 


Арифметические команды 

Набор арифметических команд ХММ-расширения включает в себя обычные ко- 
манды для выполнения арифмет ических операций. Особенность ЭТОГО набора ВТОМ, 
что он содержит два типа арифметических операций: скалярных и параллельных. 
Отличить эти команды можно по их мнемонике: скалярные команды имеют суф- 
фикс $, а параллельные — суффикс Р. Команды скалярных арифметических опера- 
ций обрабатывают только младшие 32-разрядные двойные слова упакованных 
операндов, остальные двойные слова в операции не участвуют и не изменяются. 
Команды параллельных арифметических операций обрабатывают одновременно 
четыре упакованных двойных слова. Заметьте также, что в наборе команд ХММ- 
расширения присутствуют команды для операции деления, которых не было в це- 
лочисленном ММХ-расширении. 


Сложение и вычитание 

АООР$ ($ИВР5)) приемник, источник — параллельное сложение (вычитание) эле- 
ментов операндов приемник и источник. Операнды должны иметь формат ХММ. 
Результат операции помещается в приемник — ХММ-регистр. Источник мо- 
жет быть ХММ-регистром или 128-разрядной ячейкой памяти. 

А065$ ($1855) приемник, источник — скалярное сложение (вычитание) операн- 
дов приемник и источник. Младшие двойные слова операндов должны быть чис- 
лами с плавающей запятой в коротком формате. Результат помещается в опе- 
ранд приемник. Приемник должен быть ХММ-регистром. Источник может быть 
ХММ-регистром или 32-разрядной ячейкой памяти. Содержимое старших би- 
тов операндов не принципиально и не меняется. 


Умножение и деление 

МИТР5$ (01\Р$) приемник, источник — параллельное умножение (деление) операнда 
приемник на операнд источник. Операнды должны иметь формат ХММ. Резуль- 
тат операции помещается в приемник — ХММ-регистр. Источник может быть 
ХММ-регистром или 128-разрядной ячейкой памяти. 

МИЕ5$ (015$) приемник, источник — скалярное умножение (деление) операнда 
приемник на операнд источник. Младшие двойные слова операндов должны быть 
числами с плавающей запятой в коротком формате. Результат помещается в при- 
емник. Приемник должен быть ХММ-регистром. Источник может быть ХММ- 
регистром или 32-разрядной ячейкой памяти. Содержимое старших битов опе- 
рандов не имеет значения и не меняется. 


Извлечение квадратного корня 

$АКТР$ приемник, источник — параллельное извлечение квадратного корня из 
упакованных чисел с плавающей запятой операнда источник в формате ХММ. 
Результат помещается в операнд приемник — ХММ-регистр. Источник может 
быть ХММ-регистром или 128-разрядной ячейкой памяти. 

5@КТ$5 приемник, источник — скалярное извлечение квадратного корня из упако- 
ванного числа с плавающей запятой операнда источник в формате ХММ. Ре- 
зультат помещается в операнд приемник. Приемник должен быть ХММ-регист- 
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ром. Источник может быть ХММ-регистром или 32-разрядной ячейкой памя- 
ти. Если источник — ХММ-регистр, то в операции извлечения участвует толь- 
ко число с плавающей запятой в его младшем двойном слове. Содержимое стар- 
ших битов операндов не принимается во внимание и не меняется. 


Извлечение максимальных/минимальных значений операндов 


МАХР$ (М1МР5) приемник, источник — параллельное извлечение максимальных 
(минимальных) значений из каждой пары упакованных чисел с плавающей за- 
пятой операндов источник и приемник в формате ХММ. Результат формируется 
из максимальных (минимальных) значений каждой пары и помещается в при- 
емник — ХММ-регистр. Источник может быть ХММ-регистром или 128-раз- 
рядной ячейкой памяти, и его содержимое не меняется. 


МАХ$5$ (М1М$5)) приемник, источник — скалярное извлечение максимального (ми- 
нимального) значения из младшей пары упакованных чисел с плавающей за- 
пятой операндов источник и приемник в формате ХММ. Результат формируется 
измаксимального (минимального) значений каждой пары и помещается в при- 
емник — ХММ-регистр. Источник можетбыть ХММ-регистром или 32-разрядной 
ячейкой памяти, и его содержимое не меняется. Если источник — ХММ-регистр, 
то в операции сравнения и извлечения участвует только число с плавающей 
запятой в его младшем двойном слове. 


Команды сравнения 


Команды сравнения также делятся на два типа: скалярные и параллельные. Эти 
команды или их комбинации поддерживают полный набор условий сравнения. 
Обратите внимание на формат команд — он несколько необычен, так как условие 
сравнения задается непосредственно в операнде. 


СМРР5 приемник, источник, условие — параллельное сравнение значений каждой 
пары упакованных чисел с плавающей запятой операндов источник и приемник 
в формате ХММ. Условие, по которому производится сравнение, определяется 
третьим операндом, представляющим собой непосредственное значение. Резуль- 
тат сравнения формируется в приемнике — ХММ-регистре. Источник может 
быть ХММ-регистром или 128-разрядной ячейкой памяти, и его содержимое 
не меняется. Изменяется только значение приемника, которое замещается 32- 
разрядными значениями 000000008 или ОН в зависимости от результата 
(00000000 — если условие не выполняется для данной пары значений упако- 
ванных чисел операндов источник и приемник, и ОННЕН, если условие выполня- 
ется). 

СМР5$ приемник, источник, условие — скалярное сравнение младших пар чисел с 
плавающей запятой в коротком формате операндов приемник и источник. Усло- 
вие, по которому производится сравнение, определяется третьим операндом, 
представляющим собой непосредственное значение. Результат сравнения фор- 
мируется в приемнике — ХММ-регистре. Источник может быть ХММ-регист- 
ром или 32-разрядной ячейкой памятн, и его содержимое не меняется. Изменя- 
ется только значение приемника, младшее двойное слово которого замещается 
32-разрядным значением 00000000 или ОННЪ в зависимости от результата 
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(00000000Ъ — если условие не выполняется для младшей пары чисел с плаваю- 
щей запятой в коротком формате из операндов источник и приемник, и ОЕ, 
если условие выполняется). 


Предыдущие две команды сравнивали операнды, изменяя при этом содержи- 
мое операнда приемник. Следующие две команды позволяют выполнить операцию 
сравнения без изменения его содержимого, но с одним ограничением — эти коман- 
ды являются скалярными. По результатам их работы устанавливаются флаги 
в регистре ЕЕТАб$. 


С0МТ5$ приемник, источник, условие — скалярное сравнение младших пар чисел 
с плавающей запятой в коротком формате операндов приемник и источник. Ус- 
ловие, по которому производится сравнение, определяется третьим операндом, 
представляющим собой непосредственное значение. Результат сравнения фор- 
мируется установкой флагов в регистре ЕЕТАб$ (устанавливаются флаги Е, РЕ, 
СЕ и сбрасываются флаги ОЕ, $Е, АР). Приемник должен быть ХММ-регистром. 
Источник может быть ХММ-регистром или 32-разрядной ячейкой памяти. 
Содержимое приемника и источника не меняется. 


(С0МТ$$ приемник, источник, условие — неупорядоченное скалярное сравнение 
младших пар чисел с плавающей запятой в коротком формате операндов при- 
емник и источник. Данная команда отличается от команды (С0МТ5$ тем, что по- 
зволяет обнаружить ситуацию, когда младшие 32 бита приемника являются 
«тихим» или сигнальным не-числом. Результат сравнения формируется уста- 
новкой флагов в регистре ЕЕАб$ (устанавливаются флаги 7Е, РЕ, (РЕи очищают- 
ся флаги ОЕ, $Е, АЕ). Приемник должен быть ХММ-регистром. Источник может 
быть ХММ-регистром или 32-разрядной ячейкой памяти. Содержимое прием- 
ника и источника не меняется. 


Команды преобразования 


Эта группа команд обеспечивает взаимное преобразование значений трех форма- 
тов: формата ХММ, формата ММХ и обычного целочисленного двоичного форма- 
та представления числа в одном из регистров общего назначения. Набор команд 
также делится на два класса: скалярные и параллельные. 


СУТРГ2Р5 приемник, источник — параллельное преобразование двух 32-разрядных 
целочисленных значений в операнде источник, которым является ММХ-регистр 
целочисленного ММХ-расширения или 64-разрядная ячейка памяти. Операнд 
источник содержит два 32-разрядных целочисленных значения. Результат пре- 
образования представляется в виде двух 32-разрядных чисел с плавающей за- 
пятой в коротком формате. Эти значения размещаются в двух младших двой- 
ных словах ХММ-регистра, представляющего собой операнд приемник. Старшие 
два двойных слова в приемнике не изменяются. Если не удается получить точ- 
ный результат преобразования, то производится его округление в соответствии 
с режимом, заданным в соответствующих битах регистра МХСЗВ. 


* СУТР$2Р] приемник, источник — параллельное преобразование двух 32-разрядных 


чисел с плавающей запятой в коротком формате, содержащихся в двух млад- 
ших двойных словах операнда источник, в два 32-разрядных целых значения. 
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Операнд источник представляет собой ХММ-регистр или 64-разрядную ячейку 
памяти. Операнд приемник является адресом 64-разрядной ячейки памяти. Дан- 
ная команда выполняет действие, обратное команде СУТРТ2Р5. Если не удается 
получить точный результат преобразования, то производится его округление 
в соответствии с режимом, заданным в соответствующих битах регистра МХС$К. 


В системе команд ХММ-расширения существует другой вариант последней 
команды — СУТТР52РТ, которая перед преобразованием отбрасывает дробную 
часть операнда источник. 


? (С\Т$125$ приемник, источник — скалярное преобразование одного 32-разрядного 
целочисленного значения из операнда источник в одно 32-разрядное число с пла- 
вающей запятой в коротком формате в операнде приемник. Операнд источник 
представляет собой один из 32-разрядных регистров общего назначения или 
32-разрядную ячейку памяти. Результат преобразования в виде одного 32-раз- 
рядного числа с плавающей запятой в коротком формате помещается в млад- 
шее двойное слово 128-разрядного операнда приемник, представляющего собой 
ХММ-регистр. Старшие три двойных слова в операнде приемник не меняются. 
Если не удается получить точный результат преобразования, то производится 
его округление в соответствии с режимом, заданным в соответствующих битах 
регистра МХС$В. 


С\Т$$2$1 приемник, источник — скалярное преобразование одного 32-разрядного 
числа с плавающей запятой в коротком формате из операнда источник в одно 
32-разрядное целое число в операнде приемник. Операнд источник представляет 
ХММ-регистр или 32-разрядную ячейку памяти. Результат преобразования 
в виде одного 32-разрядного целочисленного значения помещается в операнд 
приемник, который является 32-разрядным регистром общего назначения. Стар- 
шие три двойных слова в операнде приемник не меняются. Если не удается по- 
лучить точный результат преобразования, то производится его округление в со- 
ответствии с режимом, заданным в соответствующих битах регистра МХС$К. 


В системе команд существует другой вариант последней команды — С\УТТ5$251, 
которая перед преобразованием отбрасывает дробную часть операнда источник. 


Логические команды 


Все логические команды являются параллельными и реализуют над парами битов 
в обоих операндах логические операции И, И-НЕ, ИЛИ, исключающее ИЛИ. 


АМОР5$ приемник, источник — параллельное выполнение логического умножения 
(операция логического И) над парами битов упакованных чисел с плавающей 
запятой операндов источник и приемник в формате ХММ. Результат операции 
логического умножения формируется в операнде приемник — ХММ-регистре. 
Источник может быть ХММ-регистром или 128-разрядной ячейкой памяти, 
и его содержимое не меняется. Изменяется только значение приемника. 


* АМОМР5 приемник, источник — параллельное выполнение логической операции 
И-НЕ над парами битов упакованных чисел с плавающей запятой операндов 
источник и приемник в формате ХММ. Результат выполнения логической опе- 
рации И-НЕ формируется в операнде приемник. Приемник должен быть ХММ- 
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регистром. Источник может быть ХММ-регистром или 128-разрядной ячей- 
кой памяти, и его содержимое сохраняется. Изменяется только значение при- 
емника. 

ОКР5 приемник, источник — параллельное выполнение логического сложения 
(операция логического ИЛИ) над парами битов упакованных чисел с плаваю- 
щей запятой операндов источник и приемник в формате ХММ. Результат опера- 
ции логического сложения формируется в операнде приемник. Приемник должен 
быть ХММ-регистром. Источник может быть ХММ-регистром или 128-разряд- 
ной ячейкой памяти, и его содержимое остается прежним. Изменяется только 
значение приемника. 

ХОКР5 приемник, источник — параллельное выполнение логической операции 
исключающего ИЛИ над парами битов упакованных чисел с плавающей запя- 
той операндов источник и приемник в формате ХММ. Результат логической опе- 
рации исключающего ИЛИ формируется в операнде приемник. Приемник дол- 
жен быть ХММ-регистром. Источник может быть ХММ-регистром или 
128-разрядной ячейкой памяти, и его содержимое не меняется. Изменяется 
только значение приемника. 


Команды управления состоянием 
Ниже перечислены команды управления состоянием. 


ЕОМХС$К источник — команда загрузки регистра МХС$К (регистра состояния и уп- 
равления ХММ-расширения) из памяти. Источник должен быть 32-разрядной 
ячейкой памяти. 

$ТМХС$К приемник — команда сохранения содержимого регистра МХС$К (регист- 
ра состояния и управления ХММ-расширения) в памяти. Приемник должен 
быть 32-разрядной ячейкой памятн. 

ЕХЕ$ТОК источник — команда загрузки состояния сопроцессора (целочисленного 
ММХ-расширения) и ХММ-расширения в области памяти размером 512 байтов. 
РХ$АУЕ приемник — команда сохранения состояния сопроцессора (целочис- 
ленного ММХ-расширения) и ХММ-расширения в области памяти разме- 
ром 512 байтов. Подобно команде ЕЗАУЕ, команда ЕХ$АХЕ не инициализирует со- 
процессор. 


Команды перераспределения 
Ниже перечислены команды перераспределения. 


$НУЕР$ приемник, источник, маска — команда упакованной перестановки двой- 
ных слов из операндов источник и приемник в операнд приемник в соответствии с 
маской, заданной операндом маска. Источник может быть ММХ-регистром или 
128-разрядной ячейкой памяти. Результат перераспределения двойных слов 
обоих операндов помещается в приемник, который является ММХ-регистром. 
Третий операнд является непосредственным операндом. Принцип формирова- 
ния результата следующий. Младшие два двойных слова результата формиру- 
ют два из четырех двойных слов приемника. Старшие два двойных слова ре- 
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зультата формируют два из четырех двойных слов источника. Какие именно 
двойные слова будут включены в результат в качестве двойных слов, определя- 
ют биты маски. Значение первых двух битов маски определяют номер двойно- 
го слова источника, которое будет включено в результат в качестве первого двой- 
ного слова. Значение следующей пары битов (биты 2 и 3 маски) определяет 
номер двойного слова источника, которое будет включено в результат в каче- 
стве второго двойного слова. Значение следующей пары битов маски (4 и 5) 
определяет номер двойного слова приемника, которое будет включено в резуль- 
тат в качестве третьего двойного слова. Последняя пара битов маски (6 и 7) 
определяет номер двойного слова приемника, которое будет включено в резуль- 
тат в качестве четвертого двойного слова. 


ОМРСКНР$ приемник, источник — команда упакованного перемещения с чередо- 
ванием старших двух двойных слов из операндов источник и приемник в операнд 
приемник. Источник может быть ММХ-регистром или 128-разрядной ячейкой 
памяти. Результат перемещения двойных слов обоих операндов формируется 
в приемнике, который является ММХ-регистром. Принцип формирования ре- 
зультата иллюстрирует рис. 10.21. 


иупрскКВрз приемник, источник 
Источник (ХММ-регистр/т128} Приемник (ХММ-регистр) 





Приемник (ХММ-регистр) 
Рис. 10.21. Схема работы команды УМРСКНР$ 


ОМРСКЕР$ приемник, источник — команда упакованного перемещения с чередова- 
нием младших двух двойных слов из операнлов источник и приемник в операнд 
приемник. Источник может быть ММХ-регистром или 128-разрядной ячейкой 
памяти. Результат перемещения двойных слов обоих операндов формируется в 
операнде приемник, который является ММХ-регистром. Выполнение команды 
иллюстрирует рис. 10.22. 


ипрсЮрз приемник, источник 
Источник (ХММ-регистр/т128) — Приемник (ХММ-регистр) 





Приемник (ХММ-регистр) 
Рис. 10.22. Схема работы команды УМРСКЕР$ 


Команды управления кэшированием 


Команды ХММ-расширения, рассмотренные в этом разделе, позволяют программи- 
сту управлять кэшированием данных. До появления моделей процессора с ХММ- 
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расширением в системе команд ТА-32 было несколько команд, которые влияли на 
работу кэша, но они не отличались гибкостью и с их помощью тяжело было учесть 
особенности конкретной задачи. Потребность оптимизировать работу кэша воз- 
никла из-за болыного объема данных, которыми манипулирует большинство муль- 
тимедийных приложений. Чтобы предотвратить загрузку в кэш данных, которые 
впоследствии могут вообще не понадобиться, были введены специальные коман- 
ды. Более того, с помощью новых команд можно организовать загрузку данных 
заранее, то есть до того, как они реально будут востребованы. Понятно, что это 
поднимет скорость работы приложений. 

Вначале будут рассмотрены три команды, которые обеспечивают программное 
управление записью данных в память из регистров целочисленного или потоково- 
го ММХ-расширений, обеспечивая при этом минимальное «загрязнение» кэш-па- 
мяти. 

*_ МАЗКМОМА источник, маска — команда выборочного сохранения в памяти байтов 
упакованного целого числа из ММХ-регистра. Источник является ММХ-реги- 
стром целочисленного ММХ-расширения. Местоположение приемника в па- 
мяти задано неявно содержимым пары 05:61/ЕОТ. Маска определяет, какие бай- 
ты будут сохранены в памяти. Это делается следующим образом. Значение для 
данной команды имеет знаковый разряд каждого упакованного байта маски. 
Если он равен 1, то значение соответствующего байта из источника (ММХ-ре- 
гистра) копируется в соответствующий байт памяти. Если же он равен 0, то 
содержимое соответствующего байта из источника в память не переносится. 
Наглядно этот процесс иллюстрирует рис. 10.23. Особенностью команды 
МАЗКМОМА (и, собственно, причиной, по которой она включена в данную группу 
команд) является то, что при записи информации из регистров в память не про- 
изводится кэширования этой информации и таким образом отсутствует загряз- 
нение кэш-памяти первого или второго уровня. 


пазкгтома источник, маска 


Пример: тазКтоуд гтгпх0, глпх1 






Маска (ХММ-регист 
р ре 


У У У У 
Приемник (тб4) = Е 3 


<—— Старшие адреса оперативной памяти 





95:а/ед 
Рис. 10.23. Схема работы команды МАЗКМОУО 


МОУМТО приемник, источник — команда сохранения в памяти упакованных целых 
чисел в целочисленном формате ММХ. Источник является ММХ-регистром 
целочисленного ММХ-расширения. Приемником является 64-разрядная ячейка 
памяти. Запись в память производится минуя кэш-память. 

МОУМР5 приемник, источник — команда сохранения в памяти упакованных чисел 
с плавающей запятой в формате ХММ. Источник представляет собой ХММ- 
регистр. Приемником является 128-разрядная ячейка памяти, адрес которой 
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должен быть выравнен по границе параграфа (по значению, кратному 16). За- 

пись в память производится минуя кэш-память. 

Таким образом, приведенные выше три команды отличаются от обычных ко- 
манд пересылки политикой работы с кэш-памятью. 

После общего обзора возможностей ХММ-расширения рассмотрим несколько 
практических примеров программирования и пути рещения специфических про- 
блем, которые при этом могут возникать. Начнем с рассмотрения порядка описа- 
ния данных, которыми манипулируют ХММ-команды Репнит Ш(А). 


Описание упакованных и скалярных данных 


Описание ХММ-данных в приложении обычно производится в одном из двух 
форматов: 
*” в массиве структур; 

в структуре, элементами которой являются массивы. 

Описание точек изображения в трехмерном пространстве принято задавать 
в виде четырехмерного вектора (х, и, 2, @). Это связано с тем, что проекционные 
преобразования, необходимые для показа изображения с различных точек зрения, 
проще всего описываются матрицами 4 х 4. Используя перечисленные выше форма- 
ты задания ХММ-данных, совокупность точек в трехмерном пространстве можно 
описать двумя способами. 
” Первый способ — для каждой точки определить свой экземпляр структуры: 


ротие_30 $гис 
х 94 0.0 
У 94 0.0 
2 99 0.0 
м 94 0.0 
еп 
.даха 
р1 ролпё_30 4 ар (<=>) : описание пирамиды массивом структур. 


: каждая из которых представляет 
: Одну из четырех вершин 


Второй способ — все точки описать одной структурой, элементами которой яв- 
ляются массивы координат х, у, 2, М: 


а. 20= {Ж, Ус, 2о, М0} 1-й способ: 2-й способ: 
а1 = {жи, Уч, 24, м} 
а2 = {х», у, 22, \2} Оперативная 


ас а2 аз={жь, Уз, 23, №3} 0 память Г. 
[жж |] 
Воры 


аз 


Гео 2 223. 
мм 
в 





Рис. 10.24. Расположение в памяти описания вершин пирамиды 
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рг15т_ро?иё_30 $Егис 
х 94 


4 бир (0.0) 
у 99 4 @р (0.0) 
2 99 4 @ир (0.0) 
м 99 4 вр (0.0) 
епа$ 
‚ дата 
ргл$т рг1$т_ротиё_36 <> ; структура. описывающая 


: треугольную пирамиду {4 вершины) 


Приведенные выше примеры описания пирамиды иллюстрирует рис. 10.24. 

В большинстве приложений используется первый способ представления ХММ- 
данных, хотя он и считается менее эффективным. При необходимости можно про- 
извести перевод из одного представления данных в другое. Вариант такого преоб- 
рАЗВеОНИЯ показан ниже, 


: Программа: рг910_01.а5т. 
Преобразование ХММ-данных из одного представления в другое. | 


рг12м $егис 

иптой 

5гис ; описание треугольной пирамиды (1) 
хугм1 94 0.0 

хулн2 94 0.0 

хугм3 09 0.0 

ху7м4 99 0.0 

ей0$ 

5гис ; описание треугольной пирамиды (2) 
х [6] 4 бир (0.0) 
у да 4 бр (0.0) 

2 да 4 бир (0.0) 
м 93 4 @р (6.0) 

епд5 

епд$ ; конец объединения 

епа$ 

дата 

рг12т 1 рглам <> : экземпляр объединения 

сое 

------ преобразование представлений вершин пирамиды (на месте) 
Теа $1, рг17т_1 
поУ71рз гхимб. [$1] $ ГХО = ? 7 у0 хб 


поУйр$ гжимб, [$1+16] : гхит0 = у1 х]1 у0 хо 
поу]рз гхит2, [51+32] ; гхттё = ? ? уё хё 
поуйр5 гхи. [5$1+48] :; гхи? = уЗ3 хЗ у? хё 
почар$ гхи]. гхитб ; гхи] = у1 х1 У0 х0 
зВиРр$ гхит0. гхит?. 88Н ; гхитО = хЗ х2 х1 х0 
зиер$ гхи. гхи. ОдОп : гхт] = УЗ у2 У1 у0 
пом1р$ гхитё. [51+8] $; гжмтё = ? ? м0 20 
поУИр5 гхпир. [51+24] : гхтиё = м] 21 м0 70 
поу1р5 гхиии. [51+40] : гжиий = ? ? мё 22 
поУИр5 гхиий. [51+56] : гхи = м3 23 м2 22 
поуар5 гхтмЗ, гхит2 ; ГХИЗ = м] 21 м0 20 
ЗНиТр$ гхитё, гхитё, 888 ; гхи? = 23 12 21 20 
Пи р$ гхттЗ. гхитй. Оа9А ; гхттЗ = м3 м? м1 м0 
у------ на выходе получим следующее состояние ХММ-регистров: 
; ВХММО = ХЗ х2 х1 х0. КХММ| = УЗ у2 У1 У0. 
КХММ2 = 23 72 21 20. КХММЗ = м3 м2 м1 м0. 
теперь их необходимо сохранить в памяти 
поуир$ [$1]. гхттб 
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поуир$ [5$1+16]. гхи] 
помир$ [51+32]. гхитё 
пюуир$ [5$1+48]. гхлт3 


Описание скалярных данных намного проще — это обычные значения с плава- 
ющей запятой в коротком формате: 


„дата 

5са1_геа1 94 1.0 ; описание скалярного ХММ-значения 
Примеры использования команд 
ХММ-расширения 


Ниже будут рассмотрены несколько типовых примеров использования команд 
ХММ-расширения. Основная цель — демонстрация методики работы с основны- 
ми группами команд ХММ-расширения. Начнем с реализации простейших опера- 
ций — сложения и умножения. 


Сложение и умножение двух упакованных ХММ-значений 
Задача — вычислить скалярное произведение двух векторов, каждый из которых 
состоит из четырех вещественных чисел в коротком формате. Если в качестве та- 
ких векторов взять два вектора А и В, то их произведение вычисляется по фор- 
муле: 
АхВ-а хр ча, хЬ, а, хЬ, +а, х., 

В программной реализации с использованием ХММ-команд это выглядит так, 
как показано ниже. 
: рг910_02.а$т 


.дата 

хи _раск_1 [6 1.0. 2.0. 3.0. 4.0 

хи" раск_2 да 5.0. 6.0. 7.0, 8.0 

гег_5ит 94 0.0 : результат сложения 
.соде 


поуар$ гжии0. хп раск_1 :; ВХММО = 4.0, 3.0. 2.0. 1.0 


муТр5  гхии0. хит раск_2 : АХММО = 4.0*8.0. 3.0*7.0. 
: 2.0*6.0. 1.0*5.0 
помар$ гхийф. гхтто ; ВХММ = 4.0*8.0. 3.0*7.0 
: 2.0*6.0. 1.0*5.0 
эНир$ гхит1. гхит?. 4ев : ВХММТ = 2.0*6.0. 1.0%5.0 
: 4.0*8.0. 3.0*7.0 
адар$  гхтт0. гхи] те 


ЕВыЫЕг ВХММО = 4.0*8.0. 3.0%7.0. 2.0*6.0. 1.0*5.0 
. + 
ВХММ1 = 2.0*6.0. 1.0%5.0. 4.0*8.0. 3.0*7.0 
ВХММО = 4.0%8.0+2.0*6.0. 3.0%7.0+1.0*5.0. 


2.0*6.0+4.0%8.0. 1.0%5.0+3.0%*7.0 
или 


ВХММО = 44.0. 26.0. 44.0. 26.0 

поуар$ гхи. гхтто ; КХММ1= 44.0. 26.0. 44.0. 26.0 
звийр$ гхи. гхи. ИВ ; ВХММ1= 26.0, 44.0. 26.0. 44.0 
а94р$  гхтт0. гхтт1 : складываем 


в = ВХММО = 44.0. 26.0. 44.0. 26.0 
: + 
ВХММ1 = 26.0, 44.0. 26.0. 44.0 
КХММО = 70.0, 70.0, 70.0. 70.0 
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1------ сохраняем результат 
0\у5$  ге2_вит, гхи 


Умножение матрицы на вектор 


Умножение матрицы на вектор — наиболее характерная операция для вычисле- 
ний в области машинной графики. Существуют различные способы формирова- 
ния трехмерного изображения. В наиболее простом случае изображение на экране 
задается в виде опорных точек. К примеру, рассмотрим вариант, когда на экране 
находится трехмерное изображение, состоящее из отрезков прямых. Необходимая 
для его формирования информация хранится в памяти как список опорных то- 
чек — концов отрезков. Если изображение дается в трехмерной проекции, то опи- 
сание каждой точки удобно задать в виде четырехмерного вектора (х, и, 2, &). Вклю- 
чение в трехмерный вектор (х, и, 2) дополнительной координаты ш объясняется 
тем, что проекционные преобразования, необходимые для показа изображения с 
различных точек зрения, описываются матрицами 4 х 4. Поэтому для удобства ре- 
ализации проекционных преобразований, зачастую сопровождаемых операциями 
умножения матрии и векторов, трехмерный вектор (х, и, 2) представляют в виде 
четырехмерного вектора (х, и, г, №), где значение # обычно принимается равным 1. 
Для выполнения самого преобразования подготовленная заранее опорная матри- 
ца умножается на этот вектор, в результате чего получается четырехмерный вектор 
(х, у, 2, и’). Для обратного перехода к требуемому трехмерному вектору необхо- 
димо разделить координаты д’, у’, г' на м”, после чего удалить четвертую координа- 
туш”. 
Матрица М преобразования и вектор У имеют следующий вид: 
Ту т т» тих 
То т т ту 
Тут», Ш» туз? 
тут тт = 1 
Преобразования координат выполняются по формулам: 
х=ххту +ухт, +2хт,, +1хт, 
у =ххт, +ухт,, +.хт,+1хт, 
2=ххту +ухт,, +2хт., +1хт,. 
и -ххту +ухт. +2хт, +1хт;; 
Для получения преобразованных координат в виде трехмерного вектора (х; у, 2) 
делимл”, и', 2’ наш: 
хх /ю' = (ххтулухти+2хт+1 хт)/(ххтучухти+2хт,+1хт.,) 
у=и/ш” = (ххть+ухт,+2хт,,+1 хт)/(ххть+ухти+ехт.„+1хт.:) 
2=7/ш' = (ххтучухт»+гхт,+1хт,)/(ххт,ухтуь+2х т,,+1хт.,) 
Элементы матрицы и векторов представлены числами с плавающей запятой 
в коротком вещественном формате {4 байта). 


Ниже приведены два варианта программы умножения матрицы на вектор — 
один при помощи стандартного сопроцессора, другой с использованием команд 
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ХММ-расширения (посредством профилировщика можно сравнить скорость пре- 
образования). Результирующий трехмерный вектор замещает исходный. 
Подпрограмма умножения матрицы 4 х 4 на четырехмерный вектор с исполь- 
зованием стандартного сопроцессора состоит из двух частей. Сначала вычисляет- 
ся собственно произведение четырехмерной матрицы на четырехмерный вектор. 
Затем полученный четырехмерный вектор преобразуется в трехмерный посред- 


ством деления его компонентов на его четвертую координату. 


: рг910_03.а$т 
„Дафа 
хугм 94 


М 99 

.собе 
Теа” 
Теа 
Ни 
а 
йа 
На 
а 


хог 
ОУ 


гом: 
ти] 
Йа 
ти] 
Тад9 
а 
ти] 
Тада 
а 
ти] 
тада 
{р 
ада 
ада 
дес 
Зи7 


------ теперь необходимо разделить 


Теа 


СУСТ: {а 


у; 


Т5&р 
ада 
дес 
372 


3 ар (0.0). 1.0 


16 бир (0.0) 


01, ху2м 
х. М 


Омога рёг [91+8] 
Омога рёг [91+4] 
Чиога рег[а1] 
есх. есх 

сх. 4 


ое яО умножаем очередную строку н 
"а : первый элемент очередной строки 

; умномить на х 

; второй злемент строки М 

; умножить на у 

: накопление суммы 

:; третий элемент строки М 

: умножить на 2 


Чиога рЕг[Ьх] 
$. $Е(1) 

Омога рёг [Ьх+4] 
5$. $2(3) 


@мога рёг [Ьх+8] 
$4. $#(4) 


Омога рёг [6х+12] : 
5. $(5) 


Чиога рёг [91] 
91.4 

Ьх. 16 

сх 

гом 


91. ху7и 

Чнога рёг [91+12] ; 
сх. 4 

Чиога рег [91] 


$6(0)/5Е(1)->54(0) : 


нога рёг [91] 
91. 4 

сх 

сус1 


: исходные координаты точки 
; (необходимо инициализировать) 

ги \=1.0 

: матрица преобразования расположена 
; по строкам (нужно инициализировать) 


: адрес вектора 

: адрес матрицы М 

: инициализировать сопроцессор 
Омога рёг [91+12] ; 
; ВКЛЮЧИТЬ В стек 2 
; включить в стек у 
; включить в стек х 


включить в стек м 


счетчик строк матрицы М 
на (х. у. 2. м) 


накопление суммы 
: четвертый злемент строки М 


; умножить на м 
: накопление суммы 

: запомнить элемент вектора 

: на следующую координату в ху2м 
: к следующей строке М 


: повторить (всего 3 раза) 
полученные х’. у'. 7’. 
; адрес вектора 


м’ в стек 


м’ нам 


: очередную координату в стек 


делим на и’ 


: запоминаем очередную координату 
; к следующей координате 


у------ получили (х, у. 2. 1) => убираем м=1 
. и получаем результат преобразования (х. у. 2) 


Подпрограмму умножения матрины 4 х 4 на четырехмерный вектор с исполь- 


зованием ХММ-расширения иллюстрирует следующий листинг. 


: рг910_04.а5т 
.дафа 


:АЕТСМ 16 
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ху2м 94 3 @р (2.0). 1.0 : исходные координаты точки 
; (необходимо инициализировать} 
:им=1.0 
М 94 16 @р (0.0) ; матрица преобразования расположена 
: по строкам (нужно инициализировать) 
.с0де 
]еа е@1. ху2м ; адрес вектора 
Теа еБх. М :; адрес матрицы М 
пу есх, 4 ; повторений цикла 
помир$ гхптО. ху7м ; загружаем вектор 
гом: Поуир$ гхи. гхлию ; копируем вектор 
Юмир$ гхттё. [ебх] : загружаем очередную строку М 
му]р$  гхитё. гхмий. : умножаем вектор на строку М 
ВЕ складываем частичные произведения 
ВиРр$ гхтт]. гхитё. баН 
ад4р$  гхит?. гхи 
5пиТр$ гхлтЗ. гхит?, 1 
8045$  гхттЗ, гхияё ; скалярное сложение 
по\у5$ — [641]. гхитЗ : скалярная пересылка 
:------ готовимся к вычислению следующей координаты 
а0а ет. 4 
Тоор гом 
+++ теперь необходимо разделить полученные х'. у'. 2’. и’ нам' 
Теа ед1. хугм ; адрес вектора 
ПоУир5 гхммО. хугм : загружаем вектор (х'. у’, 2’. м’) 
тоу$$  ГЖИ1. гхмИЮ : пересылка м" 
ЗПиРр$ гхитЁ. гхи, 6 ; размножаем м’ 
91ур$  гхитб. гхи 
помир$ ху2м. гхтто : сохраняем новое значение вектора 
------ получили (х. у. 2. 1) => убираем м=1 
: и получаем результат преобразования (х. у. 2) 
Поворот изображения 


Следующая проблема, постоянно решаемая в задачах двухмерной графики, — по- 
ворот изображения на определенный угол. Преобразование координат (24, 1) опор- 
ных точек при повороте на угол © может выполняться по следующим формулам: 
х', = хх с05а, + у, Х ЭТО, 
и, = —х, х эта + у, Хх с0$4. 

Здесь х, и у, — координаты опорных точек, 1 - 0... — 1, п — число опорных точек 
изображения. 

Аналогично программе умножения матрицы на вектор приведем два варианта 
программы поворота двухмерного изображения (пусть это будет прямоугольник) — 
с использованием сопроцессора и при помощи ХММ-расширения. 

В представленной ниже программе поворота изображения с использованием 
стандартного сопроцессора предполагается, что координаты прямоугольника хра- 
нятся в виде массива вещественных чисел короткого формата. Элементы массива 
логически представляют собой последовательность — х0, у0, х1, У1, х2, уг, хЗ, у3. 
Угол поворота в радианах находится в переменной а. 

: рг910_05.азт 


„Чата 
:------ координаты квадрата (необходимо инициализировать) 
: х0. У0. х1, У1. ха, у2. хЗ. УЗ 
маз_ху 09 8 @р (0.0) 
С: да 0.0 : угол (необходимо инициализировать) 
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.соде 


Теа $1. паз_ху 
ЮУ есх. 4 
Ни 
у-е---- вычисляем $1паи с05 а 
Яд а 
1$1й 
хсп 
105 
Фхсв 
Т5фр а 
Бе яех поворот изображения 
СУСТ: 1119 мога рёг [$1] 


1114 мога рёг [$1+21 : 
#19 $41) 

На $(1) 

ти] $. $Е(5) 

хсИ 

ти] 56. 56(4) 

тада 

И $р  мога рёг[$1] 
ти] $6. $%(2) 

Тхсп 

ти] $, $(3) 
Т5ибг 

Е15р  мога рг[$1+4] 
а99 $1. 8 

дес сх 

372 Сус] 
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; цикл 4 раза - по количеству вершин 


: включаем в стек угол 
; Вычисляем $1п а 

: меняем $2(0)<->$ (1) 
: вычисляем с0$ а 

: меняем $%(0)<->54(1) 
: выталкиваем а 


: Включить в Стек координату х элемента 


включить в стек координату у элемента 


: Дублируем их 


; вычислить у * $1п 

; меняем $1(0)<->$4(1) 

; ВЫЧИСЛИТЬ Хх * 60$ 

; новая координата х 

: передать новое значение х в память 
: ВЫЧИСЛИТЬ У * С0$ 

: меняем $1(0)<->$4(1) 

: ВЫЧИСЛИТЬ Х %* 510 

: новая координата у 

: передать ее в память 

; продвинуть указатель массива таз_ху 


; повторить еще 3 раза 


----- в паз_ху преобразованные для поворота координаты квадрата 


Пи поворота изображения с использованием ХММ-расширения пред- 


ставлена ниже. 


; рг910_06.а$т 
„Чата 
‚АТОМ 16 


ЕЯ координаты квадрата (необходимо инициализировать) 
; х0. уб. х1. УТ. х2. у2. хЗ. УЗ 


Е 8 @р (0.0) 
а 94 0.0 


1еа е51. таз_ху 
поу есх, 4 
Ни 
ФЕБЯЕЕ вычисляем $1й а и с0$ а: 
Яд а 
1$1п 
Фхсп 
4с0$ 
Тхсв 
Т5&р а 
Т5Ёр с0$_а 
15фр $1п_а 
лено > поворот изображения 


; угол (необходимо инициализировать) 


; цикл 4 раза - по количеству вершин 


; включаем в стек угол 
; вычисляем $1п а 

: меняем $%(0)<->51(1) 
; вычисляем с0$ а 

; меняем $1(0)<->$5(1) 
: выталкиваем а 

; выталкиваем соз_а 

; выталкиваем $1п а 


ея готовим хтт-регистр ВУММ2 со значениями углов 


поу1р$ гхимё, $1 а 
тоупр$ гхит2. $1п а 


: ВХММ2 = с0$ а 51па с05$_а $1па 
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Юу55  ГХИФ. пи 


51655  гхито. 511 а : КХММ2 = с05 а $1та с0$ а -51п а 
сус1: по\]рз гхмтб. [е51] ; ВХММО = 722 уж 

поуйрз гхлмЮ. [е$1] ; ВХММО = ут хм уж 

Пир гхитО. гхи. 0Б0в ; ВХММО = х1 ут ут х1 

пиТр5  гхитО, гхииё ; КХММО = ВХММО*ВХММ2 = 


: Х1*С05 а у1*51п а у1*со5 а х1*(-51п а) 
эпиРр$ гхи. гхит0. 31й ; ВУММТ =? х1*с05_а ? ул с05 а 
а99р$ — гхитбо, гхи] : ВХММО = 7 (<1*с05 _ ачут*$1и а) 2 
: (ух а _а+х1*(-$51па)) 
5Иифр$ гхттО. гхииб. 2: ВХММО = 7? (у1* 605 _а+х1*(-51па)) 
: ©1*с05_а+у1*$1п_а) 
+ сохраняем результат: 
по\1р5 [е5$1]. гхмто 
1----- готовимся к вычислению нового положения следующей координаты 


ада е51. 8 
дес сх 


т сус1 


На этом мы закончим рассмотрение примеров программирования ХММ-рас- 
щирения. При разработке приведенных выше программ мы считали, что наштранс- 
лятор ассемблера поддерживает любые команды процессора 1ш(е|, в том числе 
и ХММ-команды. Реально ситуация далека от этой идиллии. Мы уже упоминали, 
что трансляторы ассемблера не всегда успевают за процессом развития системы 
команд. Особенно это касается транслятора ТАЗМ, который «брошен на произвол 
судьбы» фирмой Вопапа (шрп?ге), и на сегодняшний день его судьба выглядит 
достаточно неопределенной. Другие фирмы-разработчики трансляторов ассемб- 
лера мы не рассматриваем (не потому, что они хуже — просто обсуждение досто- 
инств и недостатков трансляторов ассемблера не является предметом данной кни- 
ги). Поэтому на практике всегда можно столкнуться с ситуацией, когда любимый 
и хорошо знакомый транслятор не знает системы команд новейшего процессора. 
Как быть в этой ситуации? Как, не меняя транслятора, решить задачу понимания 
неизвестных команд процессора? 


Моделирование команд ХММ-расширения 


Задачу адаптации компилятора (ТАЗМ) к новым командам процессора и, в част- 
ности, к ММХ-командам мы уже решали. Приступая к практическому использо- 
ванию ХММ-команд, вы снова столкнетесь с этой проблемой. Задачу адаптации 
ТАЗМ (или другого компилятора ассемблера) к командам ХММ-расширения мож- 
но решить двумя способами. 
Во-первых, разработать включаемый файл, в котором для каждой ХММ-коман- 
ды реализовать макрокоманду, моделирующую на базе существующих команд 
нужную ХММ-команду. Традиционно, фирма Пие|, зная об инерционности 
процесса разработки новых версий трансляторов ассемблера, вместе с подмно- 
жеством новых команд разрабатывает соответствующий включаемый файл для 
их поддержки в ассемблерных программах. Для подмножества ХММ-команд 
такой файл называется 1ахтт1пс. Он ориентирован натранслятор МАЗМ (фир- 
мы Мгсговой) и не пригоден (требует доработки) для ТАЗМ. Однако при дора- 
ботке ТАЗМ необходимо иметь в виду вопрос об авторских правах. Некоторые 
проблемы использования файла 1ахтт. ис совместно с ТАЗМ обсуждены ниже. 
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Во-вторых, можно разработать программу-препроцессор, на вход которой по- 
давать исходный файл с программой на ассемблере, содержащей новые коман- 
ды процессора, а на выходе получать текст, адаптированный для компиляции 
старым транслятором ассемблера. Этот путь имеет то преимущество, что те- 
перь при появлении новых команд можно, не внося больших корректив в тех- 
нологию разработки программ, всего лишь определенным образом модифици- 
ровать файл-препроцессор, дополнив его возможностями по обработке новых 
команд процессора. Более того, дополнив препроцессор средствами распозна- 
вания процессора (пили АМО), можно разрабатывать программы с исполь- 
зованием расширения ЗОМ№ о\\!. Рабочий материал для реализации этого спосо- 
ба вы можете найти среди файлов к книге в каталоге этой главы. 


Поддержка ХММ-команд в файле !ахтт.тс 


Текст файла1ахтт пс доступен для загрузки с официального сайта компании [пе] 
(НЕр://мллми лове[.сот)). С точки зрения структуры включаемый файл 1ахттЛпс пред- 
ставляет собой набор макрокоманд двух типов — основных и вспомогательных. 
Названия основных макрокоманд полностью совпадают с названиями ХММ-ко- 
манд, моделирование которых они обеспечивают. Вспомогательные макрокоманды 
расположены в начале файла и служат для обеспечения работы основных макро- 
команд. В частности, эти макрокоманды устанавливают тип операндов, указанных 
при обращении к основной макрокоманде, причем делают это, исходя из режима 
функционирования транслятора — 16- или 32-разрядного. Другое важное дей- 
ствие — установление соответствия между названиями ХММ-регистров и регист- 
ров общего назначения. Дело в том, что для моделирования ХММ-команд в 16- 
или 32-разрядном режиме работы ассемблера используются разные регистры об- 
щего назначения — 16-разрядные регистры в 16-разрядном режиме и 32-разряд- 
ные в 32-разрядном режиме. 

Рассмотрим процесс моделирования ХММ-команд. В качестве основы для мо- 
делирования выступает одна из команд основного процессора. Эта команда долж- 
на удовлетворять определенным требованиям. Каковы они? В поисках ответа по- 
смотрим на машинные коды ХММ-команд в приложении А учебника. Видно, что 
общими у них являются два момента: 


поле кода операции ХММ-команд состоит из двух или трех байтов, один из 
которых равен О{; 


большинство ХММ-команд использует форматы адресации с байтами то@К/М и 
$ и соответственно допускает сочетание операндов как обычных двухоперанд- 
ных команд целочисленного устройства — регистр-регистр или память-регистр. 


Для моделирования ХММ-команд нужно подобрать такую команду основного 
процессора, которая удовлетворяет этим двум условиям. Во включаемом файле 
тахиит.1пс в качестве таких команд присутствуют две — СМРХСНб и АО. В процессе 
моделирования на место нужного байта кода операции этих команд помещаются 
байты со значениями кода операции соответствующей ХММ-команды. Когда про- 
цессор «видит», что очередная команда является ХММ-командой, то он начинает 
трактовать коды регистров в машинной команде как коды ХММ-регистров и ссыл- 
ки на память размерностью, соответствующей данной команде. В машинном фор- 
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мате команды нет символических названий регистров, которыми мы пользуемся 
при написании исходного текста программы, например АХ или ВХ. В этом формате 
они определенным образом кодируются. Например, регистр АХ кодируется в поле 
тед машинной команды как 000 (двоичное). Если заменить код операции команды, 
в которой одним из операндов является регистр АХ, кодом операции некоторой 
ХММ-команды, то это же значение в поле гед процессор будет трактовать как ре- 
гистр гхтто. Таким образом, в ХММ-командах коды регистров воспринимаются 
соответственно коду операции. В табл. 10.9 приведены коды регистров общего на- 
значения и соответствующих им ХММ-регистров. В правом столбце этой таблицы 
содержится условное обозначение ХММ-регистров, принятое в файле 1ахтт.1пс. 
Это же соответствие закреплено рядом определений в этом файле, которые иллю- 
стрирует следующая программа. 


Бе! 1техмММхКед$ Масго 
ТЕОЕР АРР_168Т 
гхито ТЕХТЕЦЦИ <АХ> 
гхи ТЕХТЕЦИ <бСх> 
гхит? ТЕХТЕЦУ <0Х> 
гхи ТЕХТЕЦИ <ВХ> 
гхи ТЕХТЕДЦИ <5Р> 
гхитб ТЕХТЕЦУ <ВР> 
гхииб ТЕХТЕСИ <$1> 
гхии7 ТЕХТЕСИ <01> 
ВХММО ТЕХТЕЦИ <АХ> 
АХММТ ТЕХТЕЦИ <СХ> 
ВХММ2 ТЕХТЕЦИ <0Х> 
ВХММЗ ТЕХТЕЦУ <ВХ> 
ВХММА ТЕХТЕСИ <5Р> 
КХММ5 ТЕХТЕСИ <ВР> 
ВХММ6 ТЕХТЕСИ <51> 
ВХММ7 ТЕХТЕСИ <0]> 
Е1$Е 
гхи ТЕХТЕЦИ <ЕАХ> 
гхи ТЕХТЕЦУ <ЕСХ> 
гхитё ТЕХТЕЦУ <ЕОХ> 
гхлит3 ТЕХТЕЦУ <ЕВХ> 
гхтяё ТЕХТЕОУ <Е$Р> 
гхит5 ТЕХТЕЦИ <ЕВР> 
гхттб ТЕХТЕОИ <Е$> 
гхит7 ТЕХТЕОУ <Е01> 
КХММО ТЕХТЕСИ <ЕАХ> 
КХММ1 ТЕХТЕОУ <ЕСХ> 
КХММ2 ТЕХТЕСЦУ <ЕОХ> 
АХММЗ ТЕХТЕСИ <ЕВХ> 
КХММД ТЕХТЕЦИ <ЕЗР> 
АХММ5 ТЕХТЕЦИ <ЕВР> 
ВХММ6 ТЕХТЕЦИ <Е$]> 
КХММ7 ТЕХТЕСЦИ <Е01> 
ЕМОТЕ 
епат 


Таблица 10.9. Кодировка регистров в машинном коде команды 


Е Е о. 
ИЕ ТЕ ВЕВИИВИИОИИИЮ Г - ВНИИИИИ 
ОО аи ИРАН 







продолжение 2% 
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Таблица 10.9 (продолжение) 


и мм 
ПЕН ЕАО ВИО 
р в | 


Теперь в исходном тексте программы можно использовать символические имена 
ХММ-регистров в качестве аргументов макрокоманд, моделирующих ХММ-ко- 
манды. 

Рассмотрим, как в файле фаттх пс описано макроопределение для моделиро- 
вания ХММ-команды скалярной пересылки МО\5$. 


; РЗ ОЕ 10 /г тоуз$ хи. хитё/тЗ2 
; Е3 ОЕ 11 /г тоу$$ хитё/тЗ2, хит 
тоу$$ тасго 9$1:гед. згс:гед 

ХММ $%_13 орс_Мом$$, 45. $гс 
епдт 


Понимание структуры приведенного макроопределения не должно вызватьу вас 
трудностей. Начать следует с того, что данная команда содержит вложенный вы- 
зов макрокоманды ХММЧ_5& [3, у которой две задачи — определить вариант соче- 
тания операндов, после чего сформировать правильный код операции и подста- 
вить его на место соответствующих байтов в команде СМРХСНС. В результате этих 
действий команда СМРХСНб «превращается» в ХММ-команду М0\55. 
<1> ХММ А_51 {3 масго ор:гед. 45%:гед. згс:гед 
<2> 10са]х. у 
<3> Ое{1пехММхВед$ 
<4> ]Е (ОРАТТВ(9$%)) АХО 00010000у ; гедлзтег 
<5> х: 10Сск стрхсй9 $гс. 45% 
<6> у: огд х 
<7> Буе ОРЗН. ОГП. ор& 14 
<8> огд у 
<9> ЕЁЗЕ 
<10> х: 10ск спрхсй9 95%. $гс 
<11> у: 0г9х 
<12> Буе ОЕЗН. ОРИ. ор&_5% 
<13> огд у 
<14> ЕМОЕ 
<15> /пбе{1пехММхВед$ 
<16> епат 

Центральное место в макроопределении ХММ4_5 #3 занимают команда цело- 
численного устройства (в данном случае — СМРХСНС) и директива ОВб. Первое 
действие данной макрокоманды — выяснить тип операнда приемника (4%) в мак- 
рокоманде М0\5$, так как он может быть и регистром, и ячейкой памяти. Это необ- 
ходимо для правильного определения кода операции, которая будет управлять 
направлением потока данных. После того как определен приемник данных, с по- 
мощью условного перехода осуществляется переход на ветвь программы, где бу- 
дет выполняться собственно формирование соответствующего ХММ-команде 


М0\5$ кода операции. 
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Формирование кода операции ХММ-команды М0\$5 производится с помощью 
директивы ОЕб, которая предназначена для изменения значения счетчика адреса. 
В строках б или 11 директива ОЕб устанавливает значение счетчика адреса равным 
адресу метки х. Адрес метки х является адресом первого байта машинного кода 
команды СМРХСНб. Директива ОВ в следующих строках размёщает по этому адресу 
байтовые значения ОЕЗН, ОЁИ, ор&_4 или ОЕЗН, ОЕИ, ор&_5%, в зависимости от того, 
какое действие производится — загрузка (_14) или сохранение (_$). Значения 
орс_Мо\з5, с помощью которого формируются ор8_5 и ор&_(9, определены в нача- 
ле файла 1ахттАпс: 


орс. Моуз5_1а = 010Н 
орс_Моу$$_$ = ОН 


Интерес представляетеще один характерный момент. Он касается порядка сле- 
дования операндов в команде и роли бита 4 второго байта кода операции машин- 
ной команды. Мы обсуждали этот момент для моделирования команд ММХ-рас- 
ширения. Для ХММ-команд рассуждения аналогичны, за исключением команды, 
на базе которой проводится моделирование — СМРХСНб. Например, значение вто- 
рого байта кода операции орс_Мо\з$_5* = 0116 (0001 0001Ъ). Его бит 4 = 1, то есть 
данные передаются из регистра в память (процессор-намять). Это нам и позволи- 
ло в команде СМРХСНб изменить порядок следования операндов, в противном слу- 
чае транслятор ассемблера команду не пропустит. Но команда МО\М5$ позволяет 
также производить передачу и в обратном направлении — память-процессор. Для 
того чтобы правильно смоделировать машинное представление ХММ-команды, 
необходимо определить, каким объектом является операнд 4е< (приемник) — ячей- 
кой памяти или регистром. После этого будет ясен тип второго операнда, так как 
реализованы могут быть лишь две схемы расположения операндов: регистр-регистр 
и память-регистр. Для выяснения типа операнда ассемблер МАЗМ (не ТАЗМ) 
предоставляет оператор ОРАТТВ, который имеет следующий синтаксис: 

ОРАТТВ (выражение) | 

Его эквивалент — другой оператор, работающий и в ТАЗМ: 
.Хуре выражение 

Эти операторы в зависимости от типа операнда, указанного в качестве выраже- 
ния, возвращают байтовые значения, которые приведены в табл. 10.3. Анализ воз- 
вращаемых значений производится строкой: 

{Е (ОРАПВ(а$%)) АМО 000100006 ; гедлзфег 

Если операнд 4е5{ — регистр, то вырабатывается один код операции, если нет, 
то — другой. 

Адреса операндов в памяти формируются таким же образом, как и для цело- 
численных команд, а их трактовка зависит от конкретной ХММ-команды. 


Модельно-зависимые регистры 


Физически модельно-зависимые средства процессора представляют собой набор 
модельно-зависимых регистров (Моде} Зресйс КеуЕегз, М5В). Наличие и назна- 
чение этих регистров по определению привязано к конкретной модели процессо- 
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ра, что, в свою очередь, не гарантирует их поддержку будущими процессорами ар- 
хитектуры пе]. Некоторые наиболее удачные из этих средств становятся стан- 
дартными для будущих моделей, а некоторые из них могут и не прижиться либо 
включаться лишь в архитектуру отдельных версий процессоров для поддержки 
специфических условий их эксплуатации. Один из модельно-зависимых регист- 
ров, ставший, если можно так выразиться, стандартом де-факто, будет рассмотрен 
в практической части данного раздела. 

М$В-регистры обеспечивают управление различными аппаратно- и программ- 
но-зависимыми средствами, включая: 


* счетчики мониторинга производительности; 
и расширения отладки; 


" средства поддержки исключения машинной ошибки и архитектуры машинно- 
го контроля (МСА); 


® регистры МТЕВ для поддержки расширенных средств кэширования. 


Чтение и запись в М5В-регистры осуществляются командами КОМ$К и М/ВМ$К. 
Большинство М$В-регистров инициализируются при программной инициализа- 
ции процессора, многие из них можно впоследствии установить в соответствии с 
конкретными потребностями программы. Приведем краткое описание команд 
ВОМ$К и МВМФВ. 


Команды ВОМ$В и \МАМ$Е 


Команда КОМ$К {Веа) йот Моде! Зречйс Верщег) выполняет чтение из М5К- 
регистра. Действие команды заключается в контроле двух условий: во-первых, 
проверяется наличие нулевого уровня привилегированности кода, во-вторых, про- 
веряется наличие в регистре ЕСХ значения, адресующего один из М$В-регистров. 
Если хотя бы одно из этих условий не удовлетворяется, то выполнение команды 
ВОМ$К заканчивается. Если удовлетворяются оба условия, то значение М$В-реги- 
стра, адресуемого содержимым регистра ЕСХ, помещается в пару 32-разрядных ре- 
гистров ЕОХ:ЕАХ. 

Команда МВМ$В (\УВКею Моде] Зресйс Керлзег) производит запись значения 
в один из 64-разрядных М$К-регистров. Действие команды заключается в конт- 
роле тех же двух условий: во-первых, проверяется наличие нулевого уровня при- 
вилегированности кода, во-вторых, команда убеждается в наличии в регистре ЕСХ 
значения, адресующего один из М$В-регистров. Если хотя бы одно из этих усло- 
вий не удовлетворяется, то работа команды завершается. Если соблюдены оба ус- 
ловия, то значение пары 32-разрядных регистров ЕБХ:ЕАХ пересылается в 64-раз- 
рядный М$В-регистр, номер которого задан в регистре ЕСХ. 


Заключение 


Мы учимся писать, читая. По-видимому, причина того, 
что мы таким же образом не учимся программировать (то 
есть, читая чужие программы), — нечитабельность болыьшин- 
ства программ. 

Динар Нурмухамедовии Бибишев 


Рано или поздно все заканчивается. Подошло к концу и изложение материала дан- 
ной книги. Наверняка найдется читатель, который скажет, что такой-то алгоритм 
более оптимально можно было реализовать другим способом, а такой-то материал 
изложить как-то иначе. Заранее принимая во внимание все возможные точки зре- 
ния, хотелось бы, тем не менее, заметить, что, на взгляд автора, материал в книге 
должен быть несколько избыточным, если хотите, «рыхлым». Это нужно для того, 
чтобы с ним могли разобраться читатели с различным уровнем подготовки. «За- 
оптимизировать» можно все, что угодно, только кому под силу будет со всем этим 
разбираться? Перефразируя известную пословицу, можно сказать: «чужой код — 
потемки». 

Не все вопросы, востребованные на практике, получили свое отражение в кни- 
ге. Признаюсь, первоначальный план книги был раза в два больше по объему, чем 
тот, что был реализован в конечном итоге. За кадром остались в основном пробле- 
мы системного программирования. Это сделано намеренно. Задачи системного 
программирования не менее важны, чем прикладного, но они тоже должны быть 
реализованы на базе обычных прикладных программ, способных достаточно про- 
фессионально взаимодействовать с пользователем и средой, в которой они функ- 
ционируют. Поэтому автор посчитал нужным уделить основное внимание базо- 
вым вопросам прикладного программирования, а тонкости системных вопросов 
оставить «на потом». Насколько это обоснованно и удачно получилось — судить 
вам, уважаемый читатель... 


Список литературы 


Приводимый ниже список литературы содержит ссылки на книги двух типов: 


10. 


11. 


источники, материал которых был использован в пронессе подготовки данной 
книги; 

источники, которые рекомендуются читателю для дальнейшего, более глубо- 
кого изучения как самого языка ассемблера, так и тех проблем, которые были 
затронуты в книге. 


Лебедев В. Н. Введение в системы программирования. — М.: Статистика, 1975. 


Костин А. Е., Шаньгин В. Ф. Организация и обработка данных в вычислитель- 
ных системах: Учеб. пособ. для вузов. — М.: Высш. шк., 1987. 

Буза М. К. и др. Лабораторный практикум по математическому обеспечению 
ЭВМ. Ч. 2. Структуры данных и методы трансляции: Учеб. пособ. для вузов. — 
Минск: Высш. шк., 1983. 


Книга в двух изданиях, достаточно сильно отличающихся друг от друга: 


И" Вирт Н. Алгоритмы + структуры данных = программы/Пер. с англ. — М.: 


Мир, 1985; 
О Вирт Н. Алгоритмы и структуры данных/Пер. с англ. — М.: Мир, 1989. 
Кнут Д. Искусство программирования, том 2. Получисленные алгоритмы: Учеб. 
пособ. 3-е изд./Пер. с англ. — М.: Издательский дом «Вильямс», 2000. 
Советов Б. Я., Яковлев С. А. Моделирование систем: Учебник для вузов по спец. 
«Автоматизированные системы управления». — М.: Высш. шк., 1985. 
Сван Т. Освоение Титфо АззетЫег. — Киев: Диалектика, 1996. 
Ахо А., Хопкрофт Дж., Ульман Дж. Построение и анализ вычислительных алго- 
ритмов/Пер. с англ. — М.: Мир, 1979. 
Гук М. Аппаратные средства локальных сетей. Энциклопедия. — СПб.: Питер, 
2000. 
Гудман С., Хидетниеми С. Введение в разработку и анализ алгоритмов. — М.: 
Мир, 1981. 
Книга в двух изданиях, достаточно сильно отличающихся друг от друга: 


С Рихтер Д. УЙоао\з для профессионалов (программирование в \т32 АР 
для УПпао\гз МТ 3.5 и УЛидо\ 95)/Пер. с англ. — М.: Издательский отдел 
«Русская редакция» ТОО «СВаппе! Тгадя 144», 1995; 


12. 


13. 


14. 


15. 


16. 
17. 


18. 


19. 
20. 


2 


— 


24. 


25. 


26. 


27. 


28. 


29. 


30. 
31. 


Список литературы 397 


о Рихтер Д. Ут4о\$ для профессионалов: создание эффективных У/1т32- 
приложений с учетом специфики 64-разрядной версии \/тдо\. 4-е изд./ 
Пер. сангл. — СПб.: Питер; М.: Издательско-торговый дом «Русская редак- 
ция», 2001. 

Дмитриева М. В., Кубенской А. А. Турбо Паскаль и Турбо Си: Построение и об- 

работка структур данных: Учеб. пособ. — СПб.: Издательство С.-Петербург- 
ского университета, 1996. 

Кнут Д. Искусство программирования. Учеб. пособ. Том 1. Основные алго- 
ритмы. 3-е изд./ПЕер. с англ. — М.: Издательский дом «Вильямс», 2000. 
Финогенов К. Г. Самоучитель по системным функциям М$-РО5. — М.: МП 
«Малип», 1993. 

Пильщиков В. Н. Сборник упражнений по языку Паскаль: Учеб. пособ. для ву- 
зов. — М.: Наука, 1989. 

Гилл А. Введение в теорию конечных автоматов. — М.: Наука, 1966. 

Хантер Р. Проектирование и конструирование компиляторов/Пер. с англ. — 
М.: Финансы и статистика, 1984. 

Мисгозой Согроганоп. Руководство программиста по МисгозоЁ УЛаао\з 95/ 
Пер. с англ. — М.: Издательский отдел «Русская редакция» ТОО «СВаппе! 
Тгадте 144», 1997. 

Бек Л. Введение в системное программирование: Пер. с англ. — М.: Мир, 1988. 
Грис Д. Конструирование компиляторов для цифровых вычислительных ма- 
шин/Пер. с англ. — М.: Мир, 1975. 


. Язык Си для профессионалов. — М.: И.В.К.-Софт, 1991. 
22. 
23. 


Гук М. Аппаратные средства ВМ РС. Энциклопедия. — СПб.: Питер, 1999. 
Использование Титфо АззетЫег при разработке программ. — Киев: Диалекти- 
ка, 1994. 

Григорьев В. Л. Микропроцессор 1486. Архитектура и программирование 
(в4 книгах). — М.: Гранал, 1993. 

Кулаков В. Программирование на аппаратном уровне. Специальный справоч- 
ник. — СПб: Питер, 2001. 

Алхо А. В., Хопкрофт Дж., Ульман Дж. Структуры данных и алгоритмы. Учеб. 
пособ./Пер. с англ. — М.: Издательский дом «Вильямс», 2000. 

Кнут Д. Искусство программирования, том 3. Сортировка и поиск. 3-е изд. Учеб. 
пособ./Пер. с англ. — М.: Издательский дом «Вильямс», 2000. 

Бентли Д. Жемчужины творчества программиста/Пер. с англ. — М.: Радио 
и связь, 1990. 

Пустоваров В. И. Ассемблер: программирование и анализ корректности машин- 
ных программ. — Киев: Издательская группа ВНУ, 2000. 

Касперски К. Техника и философия хакерских атак. — М.: Солон-Р, 1999. 
Аммерал Л. Интерактивная трехмерная графика/ Пер. сангл. — М.: Сол Систем, 
1992. 


398 — Список литературы 


32. 


33. 


ЗА. 


35. 
36. 
37. 


38. 
39. 
40. 
41. 
42. 


43. 


44. 


45. 
46. 


47. 
48. 


Кохонен Т. Ассоциативные запоминающие устройства/Пер. с англ. — М.: Мир, 
1982. 


Компаниец Р. И., Маньков Е. В., Филатов Н. Е. Системное программирование. 
Основы построения трансляторов: Учеб. пособ. для высших и средних учеб- 
ных заведений. — СПб.: Корона принт, 2000. 


Рудаков П. И., Финогенов К. Г. Программируем на языке ассемблера ВМ РС: 
в 4 частях. — М.: Энтроп, 1995. 

Зибков С. В. Ассемблер для РО$, УЛтдо\з и ОМХ. — М.: ДМК Пресс, 2000. 
Брой М. Информатика: В 4 ч./Пер. с нем. — М.: Диалог-МИФИ, 1996. 
Шилдт Г. Программирование на С и С++ для УЛа4о\ 95. — Киев: Торгово- 
издательское бюро ВНУ, 1996. 

ВЕ р://4дос.НрееК.ги/Рама/сгси1 „Вет, ВЕЕр://5ИКегок.сВаЕ.ги/гиз/дос/сгс.Нёт. 
Юров В. АззетЫег. — СПб.: Питер, 2003. 

Юров В. АззетЫег: Специальный справочник. — СПб.: Питер, 2000. 

Гук М., Юров В. Процессоры Репиит Ш, АЕТоп и другие. — СПб.: Питер, 2000. 
Григорьев В. Л. Архитектура и программирование арифметического сопроцес- 
сора. — М.: Энергоатомиздат, 1991. 

АззетЫу-Гапёцаяе Пеуеорег Зузет, Уегзюп 6.1, юг М$-2О$ апа У/шдо\5 
Ореганоп Зузет М1сгозоЁ Согрогайоп. 

Хаммел Р. Л. Последовательная передача данных: Руководство для програмис- 
та/Пер. с англ. — М.: Мир, 1996. 

Кулытин Н. Б. С/С++ в задачах и примерах. — СПб.: ВНУ-Петербург, 2001. 
Брукс Ф. Мифический человеко-месяц, или Как создаются программные сис- 
темы/Пер. с англ. — СИб.: Символ-Плюс, 1999. 

Ларин Л. К. Математическое обеспечение ЭВМ. — Киев: КВИРТУ ПВО, 1985. 
Бибишев Д. Н. Технология разработки и эксплуатации программного обеспе- 


чения. Методы и средства проектирования, реализации и сопровождения про- 
граммных комплексов: Курс лекций. — Киев: КВИРТУ ПВО, 1990. 


Юров Виктор Иванович 


АззетЫег. Практикум 


2-е издание 
Главный редактор Е. Строганова 
Заведующий редакцией А. Кривцов 
Руководитель проекта Ю. Суркис 
Литературный редактор Е. Васильев 
Художник Н. Биржаков 
Корректоры С. Беляева, И. Смирнова 
Верстка Л. Харитонов 


Лицензия ИД № 05784 от 07.09.01. 
Подписано в печать 21.07.05. Формат 70%100/16. Усл. п. л. 32.25. 

Доп. тираж 4000 экз. Заказ № 2228. 

ООО «Питер Принт». 194044, Саикт-Петербург. пр. Б. Сампсониевский, д. 29а. 
Налоговая льгота — общероссийский классификатор продукцин 
ОК 005-93, том 2; 953005 — лнтература учебная. 
Отпечатано с готовых диапозитивов в ФГУП «Печатный двор» им. А. М. Горького 
Федерального агентства по печати и массовым коммуникациям. 
197110. Саикт-Цетербург, Чкаловский пр.. 15. 


= 


изалтпьский аом 


РЕПИТЕР” — кижоовоныи 


ммм. РАТЕВ. СОМ 


ПРЕДСТАВИТЕЛЬСТВА ИЗДАТЕЛЬСКОГО ДОМА «ПИТЕР» 
предлагают эксклюзивный ассортимент компьютерной, медицинской, 
психологической, экономической и популярной литературы 


РОССИЯ 
Москва м. «Павелецкая», 1-й Кожевнический переулок, д.10; тел. /факс (095} 234-38-15, 255- 
70-67, 255-70-68; е-тай: за!е*@рйег.п5К.ги 


Санкт-Петербург м. «Выборгская», Б. Сампсониевский пр., д. 29а; 
тел./факс (812) 703-73-73, 703-73-72; е-тай: зае@рйег.сот 
Воронеж ул. 25 января, д. 4; тел./факс (0732) 39-43-62, 39-61-70; 
е-тай: риегит@сотсв. ги 
Екатеринбург ул. 8 Марта, д. 2676, офис 203, 205; тел./факс (343) 225-39-94, 225-40-20; 
е-тай: риег-игаКа6пе.ги 
Нижний Новгород ул. Совхозная, д. 13; тел. (8312) 41-27-31; 
е-тай: рие“сутюпегппом.ги 
Новосибирск ул. Немировича-Данченко, д. 104, офис 502; 
тел./факс (383) 354-13-09, 211-27-18; е-тай: риег-з6@ипзр.ги 
Ростов-на-Дону ул. Ульяновская, д. 26; тел. (863) 269-91-22, 269-91-30; 
е-тай: (ирнег@гоз.ги 
Самара ул. Аминева, д.17, тел. (846) 994-22-62, 994-69-53; е-тай: риуоча@запще!.ги 


УКРАИНА 
Харьков ул. Суздальские ряды, д. 12, офис 10—11; тел./факс (10-38-057) 712-27-05, 
751-10-02, (0572) 58-41-45; е-тай: риег@КвВагком.рИег. сот 
Киев пр. Московский, 6, кор. 1, оф.33; тел./факс (10-38-044) 490-35-68, 490-35-69; 
е-тай: обсе@риег-ргезз.КМем.ма 


БЕЛАРУСЬ 
Минск ул. Бобруйская, д. 21, офис 3; тел./факс {10-375-17) 226-19-53; 
е-глай: обсе@титзк.риег.сот 


Ищем зарубежных партнеров или посредников, имеющих выход на зарубежный рынок. 
7 Телефон для связи: (812) 703-73-73. 
Е-тай: опоопап@риег.сот 





Издательский дом «Питер» приглашает к сотрудничеству авторов. 
Обращайтесь по телефонам: Санкт-Петербург — (812) 103-73-72, 
Москва - (095) 974-34-50. 


\ 


р; Заказ книг для вузов и библиотек: (812) 703-73-73. 
(Специальное предложение — е-тай: Ко7т@ркег.сот 


\ 








Темы, рассмотренные 
В. И. Юров в книге: 


® сложные структуры 
данных; 
® рекурсивные 
й Е процедуры; 


ПРАКТИКУМ зоба 
чисел; 
работа с файлами; 
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исходных кодов; 


Преподавателям и студентам вузов, ® использование 
школьникам, специалистам, а также всем, команд ММХ и ХММ. 
кто интересуется практическими аспектами 

низкоуровневого программирования. 
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советы дополняются примерами изящного 

р Не забудьте 
решения популярных задач программирования. 
Полные тексты изучаемых программ можно купить учебник! 


найти на сайте издательства. Впрочем, и сама 
книга пестрит ассемблерными вставками, 
содержащими особо значимые 2 
и интересные места исходного кода. Практикум - 
«АззетЫег» дополняет одноименный учебник 
того же автора, выпущенный издательством 
«Питер». Книга рассчитана прежде всего АЗЗЕМ ВИЕЙ 
на студентов и специалистов, применяющих 
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